刘思喆@贝吉塔行星

关于

bjt.name 这个博客主要是用来记录和数据有关的阅读笔记以及利用公开数据做的一些小案例。

关于自己

毕业于中国人民大学统计学院,2001级统计学专业。在2002年吴喜之教授的《统计计算》课程上,第一次接触开源统计语言R,从此同开源软件结下不解之缘。毕业以后,进入中国最大的视频彩票(VLT)供应商——北京中彩在线科技有限责任公司,专职从事数据分析、数据挖掘、市场研究、彩票培训等方面工作。

后出于对电信行业成熟数据挖掘解决方案的好奇,因缘际会,至亚信联创集团股份有限公司(Asiainfo-Linkage)业务运营咨询部(BOC),神州数码集团旗下思特奇信息技术股份有限公司决策支持部,从事电信、广电行业数据挖掘、业务咨询等工作。

2012至2016年就职于京东商城,推荐系统平台部高级经理,主要负责和推荐系统离线、在线相关的用户行为、商品特征的建模,以及数据监控平台。因工作业绩,在《京东技术解密》一书中获“数据达人”称号。虽然团队管理占了很大一部分时间,但我喜欢和团队成员讨论算法及数据,有时间的话还会撸袖子写一写算法原型。

2016年8月加盟51talk(COE.us),担任首席大数据专家一职,负责和数据相关的各项工作,包括算法落地、统计分析、数据仓库等。广告一枚:51talk是一家在线英语教育品牌,于2016年6月在美国纽交所上市。在线教育是一个非常让人兴奋的行业,数据科学有极大的空间,各位看官有兴趣的话可以随时联络我。

我也热衷于数据领域的交流,任COS数据科学沙龙创始人及理事,中国人民大学大数据分析实验班校外导师2014-2016,中央财经大学统计学院硕士研究生校外指导教师2015,首都经济贸易大学信息学院校外导师2014-2016。

兴趣以及背景:

  • 统计分析,数据挖掘,数据可视化,最优化,以及一切能解决实际问题的数量分析方法。
  • 工作关系,对个性化推荐兴趣浓厚。不限于推荐算法、产品、数据收集等问题
  • 个人习惯、擅长使用 R 对数据进行处理,R的应用请参考个人博客 http://bjt.name 中 R 的应用范例。

数据挖掘、R语言培训

平日还有个嗜好——好为人师。主要有两类培训:

  1. R语言的体系培训(四天),包括
    • Introduction to R
    • Advanced R
    • R and Statistics
    • Explore and Visualization
    • Data Mining with R
    • Text Mining in R
  2. 通用数据挖掘、算法培训(两天),一般以R为工具

听过我吹牛的单位有(排名random):索尼(中国)、中国联通研究院、和君咨询、北京首钢、软控股份、中国银建、中国网通、H3C、清华大学、施耐德电气、中国电信广州研究院、日立(中国)、广州石竹、深圳证券交易所、香港乐施会、深圳龙视传媒、中国人民财产保险、亿阳信通、同洲电子、易智瑞、天元网络……

学术交流

  • 2015.11 – 2015.11 刘思喆 《京东推荐系统应用实践》 @CSDN 智能算法技术论坛
  • 2015.04 – 2015.04 刘思喆 《大数据 R 语言应用与实践》 厦门大学统计系
  • 2015.04 – 2015.04 刘思喆 《京东推荐系统实践》 @51CTO 数据库技术大会
  • 2014.12 – 2014.12 刘思喆 《机器学习技术在推荐系统中的应用》 @ 京东技术开放日
  • 2014.05 – 2014.05 刘思喆 《互联网时代的数据科学》 @ 首都经济贸易大学、北京师范大学
  • 2013.11 – 2013.11 刘思喆 《R语言在电商领域的应用》 @ Qcon上海
  • 2013.05 – 2013.05 谢邦昌、刘思喆 《DataMining 云端决策平台 CDMS Smart Score II》
  • 2013.03 – 2013.03 刘思喆 《R语言数据挖掘@京东商城》@中国人民大学
  • 2012.12 – 2012.12 刘思喆 《大数据技术开发与应用实践培训》@Big Data World forum
  • 2012.12 – 2012.12 刘思喆 《互联网时代的数据分析》@中国人民大学数据挖掘中心
  • 2012.11 – 2012.11 刘思喆 《R 语言环境下的文本挖掘》@上海财经大学
  • 2012.04 – 2012.04 刘思喆 《数据挖掘实战》@DMT
  • 2011.11 – 2011.11 刘思喆 《Data Mining With RWeka》@华东师范大学
  • 2011.11 – 2011.11 刘思喆 《R You Ready?》@CSDN 大数据技术大会
  • 2011.05 – 2011.05 刘思喆 《漫谈统计分析与 R 语言》@首都经济贸易大学
  • 2010.11 – 2010.11 刘思喆 《R与统计图形》@上海财经大学
  • 2010.06 – 2010.06 刘思喆 《中国第三届 R 语言会议基础培训》@中国人民大学
  • 2009.12 – 2009.12 谢益辉、刘思喆 Creating R Packages
  • 2009.12 – 2009.12 刘思喆 《R 在大规模数据整理及自动化报告方面的应用》@华东师范大学
  • 2008.10 – 2008.12 刘思喆 《数据挖掘过程在 R 环境下的应用》@中国人民大学

主导的挖掘和算法项目

  • 2013.09 - 今 刘思喆 《京东推荐系统算法优化 - Web, App, WeiXin, EDM》 recommendation system
  • 2013.08 – 2013.08 刘思喆 《基于用户网站行为的三级类目偏好度模型》 Gradient Descent
  • 2013.04 – 2013.06 刘思喆 《大规模数据的奇异值分解推荐引擎》 ALS, SVD
  • 2013.02 – 2013.02 刘思喆 《潜在用户识别模型》 elastic net
  • 2012.12 – 2012.12 刘思喆 《基于京东评论的新词识别模型》 N Gram
  • 2012.09 – 2012.10 刘思喆 《京东商城”不良”商品识别模型》 LASSO
  • 2011.05 – 2012.06 刘思喆 《京东商城价格弹性模型》 LM
  • 2011.12 – 2012.02 刘思喆 《网站内容分类识别模型》 Support Vecter Machine
  • 2011.07 – 2011.09 刘思喆 《某省电信公司客户流失挖掘专题》 Random Forest
  • 2011.05 – 2011.05 刘思喆 《逻辑回归模型数据库自动化实施应用》 GLMs
  • 2011.02 – 2011.04 刘思喆 《某省移动公司无线音乐业务优化》 Item Based CF
  • 2010.10 – 2010.11 刘思喆 《R 语言系列培训》Intro、Advanced、Graphics、DataMining
  • 2010.07 – 2010.07 刘思喆 《某省移动积分产品类型产品偏好模型》 logistic
  • 2010.03 – 2010.04 刘思喆 《某省移动主动营销CP模型》 randomForest
  • 2009.10 – 2009.10 刘思喆 《中福在线复杂系统因果网络》 Bayesian networks
  • 2009.04 – 2009.05 刘思喆 《中福在线销售额动态弹性分析》 Log-linear model
  • 2009.02 – 2009.03 刘思喆 《中福在线彩民流失行为之行为分析》 C4.5
  • 2008.12 – 2009.02 刘思喆 《中福在线沉迷彩民预警》 Logistic Regression
  • 2008.07 – 2008.07 刘思喆 《数据挖掘漫谈》 Data Mining
  • 2008.01 – 2008.01 刘思喆 《中福在线终端机开机率的模型求解》 Monte Carlo Simulation
  • 2007.09 – 2007.09 刘思喆 《福利彩票销售站点选址方法综述》
  • 2007.05 – 2007.07 刘思喆 《中福在线2006年年度市场报告》
  • 2006.08 – 2007.04 刘思喆 《中国福利彩票销售人员培训大纲》概率模型部分

专利

<两项,待添加>

联络方式

  • 微博:weibo.com/sunbjt/
  • 邮件:sunbjt@gmail.com

邮件太多,不能及时回复,一般都会压一段时间,请大家原谅~