个人简介(简版)

  1. 2005-2012 R语言应用专家,代表作有《153分钟学会R》、《R语言核心技术手册》等
  2. 2012-2016 电子商务推荐系统专家,在京东将推荐系统带来的订单占全京东订单量从5%,优化至10%,每天涉及七千万人民币的销售额,据此位列京东技术牛人榜(共15位)。
  3. 2016-今 在线英语教育技术专家,致力于学生的个性化学习和服务,在路上……

职业生涯依次对应了以下个人目标:

  1. 极致的技术能力
  2. 显性、具体的商业目标优化
  3. 合理组织和重构隐性因素,最终落在创造

关于自己

毕业于中国人民大学统计学院,2001级统计学专业。在2002年吴喜之教授的《统计计算》课程上,第一次接触开源统计语言R,从此同开源软件结下不解之缘。 毕业以后,进入中国最大的视频彩票(VLT)供应商——北京中彩在线科技有限责任公司,专职从事数据分析、数据挖掘、市场研究、彩票培训等方面工作。

后出于对电信行业成熟数据挖掘解决方案的好奇,因缘际会,至亚信联创集团股份有限公司(Asiainfo-Linkage)业务运营咨询部(BOC),神州数码集团旗下思特奇信息技术股份有限公司决策支持部,从事电信、广电行业数据挖掘、业务咨询等工作。

2012至2016年就职于京东商城,推荐系统平台部高级经理,主要负责和推荐系统离线、在线相关的用户行为、商品特征的建模,以及数据监控平台。 因工作业绩,被称为京东技术研发体系十五位牛人之一,“数据达人”称号(by 《京东技术解密》)。

自2016年8月起,加盟51talk(COE@NYSE),担任首席大数据专家一职,负责全公司数据相关的各项工作,包括销售流程优化、学员的个性化落地算法、决策支持的数据分析、数据平台端到端的建设、增长黑客类项目等。 虽然团队管理占了很大一部分时间,但我喜欢和团队成员讨论算法实现及数据逻辑,有时间的话还会撸袖子写一写算法原型。

我也热衷于数据领域的交流,任

  • COS数据科学沙龙创始人及理事
  • 中国人民大学大数据分析实验班硕士生校外导师2014-2016
  • 首都经济贸易大学信息学院硕士生校外导师2014-2016。

兴趣以及背景:

  • 机器学习、统计分析、最优化、数据可视化,以及一切能解决实际问题的方法。
  • 工作关系,对个性化推荐兴趣浓厚。不限于推荐算法、产品、数据收集等问题
  • 个人习惯、擅长使用 R 对数据进行处理,R的应用请参考个人博客 http://bjt.name 中 R 的应用范例。

学术交流

  • 2018.07 - 2018.07 刘思喆 《数据科学如何助力在线教育革命》@狗熊会
  • 2018.06 - 2018.06 刘思喆 《学习的个性化革命》@爱派茶馆
  • 2018.05 - 2018.05 刘思喆 《技术人如何打造个人品牌》@爱派茶馆
  • 2018.05 - 2018.05 杜亚磊、刘思喆 《R会议-软件工具专场》出品人@中国人民大学
  • 2018.05 - 2018.05 刘思喆 《数据思维、数据技术到商业价值》@和君商学院
  • 2017.10 - 2017.10 刘思喆 《搜索及推荐系统架构设计专场》出品人@SACC大会
  • 2017.05 - 2017.05 刘思喆 《基于电子商务网站商品推荐系统案例分析》@ 中央财经大学
  • 2016.05 – 2016.05 刘思喆 《R语言会议——推荐系统专场》出品人 @ 中国人民大学
  • 2016.05 – 2016.05 刘思喆 《那些年我们追过的R包》 @ 中国人民大学
  • 2015.11 – 2015.11 刘思喆 《京东推荐系统应用实践》 @CSDN 智能算法技术论坛
  • 2015.04 – 2015.04 刘思喆 《大数据 R 语言应用与实践》 厦门大学统计系
  • 2015.04 – 2015.04 刘思喆 《京东推荐系统实践》 @51CTO 数据库技术大会
  • 2014.12 – 2014.12 刘思喆 《机器学习技术在推荐系统中的应用》 @ 京东技术开放日
  • 2014.05 – 2014.05 刘思喆 《互联网时代的数据科学》 @ 首都经济贸易大学、北京师范大学
  • 2013.11 – 2013.11 刘思喆 《R语言在电商领域的应用》 @ Qcon上海
  • 2013.05 – 2013.05 谢邦昌、刘思喆 《DataMining 云端决策平台 CDMS Smart Score II》
  • 2013.03 – 2013.03 刘思喆 《R语言数据挖掘@京东商城》@中国人民大学
  • 2012.12 – 2012.12 刘思喆 《大数据技术开发与应用实践培训》@Big Data World forum
  • 2012.12 – 2012.12 刘思喆 《互联网时代的数据分析》@中国人民大学数据挖掘中心
  • 2012.11 – 2012.11 刘思喆 《R 语言环境下的文本挖掘》@上海财经大学
  • 2012.04 – 2012.04 刘思喆 《数据挖掘实战》@DMT
  • 2011.11 – 2011.11 刘思喆 《Data Mining With RWeka》@华东师范大学
  • 2011.11 – 2011.11 刘思喆 《R You Ready?》@CSDN 大数据技术大会
  • 2011.05 – 2011.05 刘思喆 《漫谈统计分析与 R 语言》@首都经济贸易大学
  • 2010.11 – 2010.11 刘思喆 《R与统计图形》@上海财经大学
  • 2010.06 – 2010.06 刘思喆 《中国第三届 R 语言会议基础培训》@中国人民大学
  • 2009.12 – 2009.12 谢益辉、刘思喆 Creating R Packages
  • 2009.12 – 2009.12 刘思喆 《R 在大规模数据整理及自动化报告方面的应用》@华东师范大学
  • 2008.10 – 2008.12 刘思喆 《数据挖掘过程在 R 环境下的应用》@中国人民大学

主导的挖掘和算法项目

  • 2016.08 - 今 刘思喆及团队 在线教育优化
    • 教师排序和个性化
    • 教学内容的自适应(推荐)
    • 营销端最优化
    • 决策支持等
  • 2013.09 - 2016.08 刘思喆及团队 京东推荐系统算法优化
    • 包括Web, App, WeiXin,EDM各端近百个推荐位
    • 场景覆盖过渡页推荐、购物车推荐、商品详情页推荐、最佳组合、关注推荐、常购商品推荐、优惠券推荐、凑单推荐……
    • 推荐订单占京东订单的比例,从2013年的5%,优化提升至10%;每千次请求的GMV从50元提升至180元
  • 2013.08 – 2013.08 刘思喆 《基于用户网站行为的三级类目偏好度模型》 Gradient Descent
  • 2013.04 – 2013.06 刘思喆 《大规模数据的奇异值分解推荐引擎》 ALS, SVD
  • 2013.02 – 2013.02 刘思喆 《潜在用户识别模型》 elastic net
  • 2012.12 – 2012.12 刘思喆 《基于京东评论的新词识别模型》 N Gram
  • 2012.09 – 2012.10 刘思喆 《京东商城”不良”商品识别模型》 LASSO
  • 2011.05 – 2012.06 刘思喆 《京东商城价格弹性模型》 LM
  • 2011.12 – 2012.02 刘思喆 《网站内容分类识别模型》 Support Vecter Machine
  • 2011.07 – 2011.09 刘思喆 《某省电信公司客户流失挖掘专题》 Random Forest
  • 2011.05 – 2011.05 刘思喆 《逻辑回归模型数据库自动化实施应用》 GLMs
  • 2011.02 – 2011.04 刘思喆 《某省移动公司无线音乐业务优化》 Item Based CF
  • 2010.10 – 2010.11 刘思喆 《R 语言系列培训》Intro、Advanced、Graphics、DataMining
  • 2010.07 – 2010.07 刘思喆 《某省移动积分产品类型产品偏好模型》 logistic
  • 2010.03 – 2010.04 刘思喆 《某省移动主动营销CP模型》 randomForest
  • 2009.10 – 2009.10 刘思喆 《中福在线复杂系统因果网络》 Bayesian networks
  • 2009.04 – 2009.05 刘思喆 《中福在线销售额动态弹性分析》 Log-linear model
  • 2009.02 – 2009.03 刘思喆 《中福在线彩民流失行为之行为分析》 C4.5
  • 2008.12 – 2009.02 刘思喆 《中福在线沉迷彩民预警》 Logistic Regression
  • 2008.07 – 2008.07 刘思喆 《数据挖掘漫谈》 Data Mining
  • 2008.01 – 2008.01 刘思喆 《中福在线终端机开机率的模型求解》 Monte Carlo Simulation
  • 2007.09 – 2007.09 刘思喆 《福利彩票销售站点选址方法综述》
  • 2007.05 – 2007.07 刘思喆 《中福在线2006年年度市场报告》
  • 2006.08 – 2007.04 刘思喆 《中国福利彩票销售人员培训大纲》概率模型部分

数据挖掘、R语言培训

平日还有个嗜好——好为人师。主要有两类培训:

  1. R语言的体系培训(四天),包括
    • Introduction to R
    • Advanced R
    • R and Statistics
    • Explore and Visualization
    • Data Mining with R
    • Text Mining in R
  2. 通用数据挖掘、算法培训(两天),一般以R为工具

听过我吹牛的单位有(排名random):索尼(中国)、澳新银行、中国联通研究院、首都机场、和君咨询、北京首钢、软控股份、中国银建、中国网通、H3C、清华大学、施耐德电气、中国电信广州研究院、日立(中国)、广州石竹、深圳证券交易所、香港乐施会、深圳龙视传媒、中国人民财产保险、亿阳信通、同洲电子、易智瑞、天元网络……

专利

<两项,待添加>