上周在部门内部做了一个小规模的R相关培训,大致把R的整体构架和特点做了个综述。聊得非常随意,天马行空。在这里,贴出概要(下图)和大家一起分享:

(顺序是:从右至左,由上至下)

红色是重点讲的部分,当然还穿插了一些关于R的八卦:比如R和SPSS、SAS之间的故事……。我发现大家对“八卦”还是相当感兴趣的:)

5月份,KDnuggets 给出了近六个月用于实际数据挖掘(非评估)项目中使用的挖掘工具调查,共364个投票人。

DM toolkit

  1. SPSS (PA)和 SAS(BA) 没啥可说的,老牌的商业数据分析软件商,尤其是 SPSS,去年就是 KDnuggets 这项调查的第一位,SPSS 的销售常拿这个说事;
  2. Excel(spreadshit),可进行“简单数据操作”的 MS 产品;
  3. RapidMiner,比较流行的开源数据挖掘软件;
  4. R ? 为数据分析而生的开源软件。说到这儿,我突然卡壳了,它能做的事情太多……。R 更贴近于数据的本质(继续鼓吹)~~

SAS、SPSS、Statistica 陆续增加了对 R 语言的支持,从这个角度来讲,这几大厂商自己都心虚了,几年后数据挖掘领域必定是 R 的天下。

原文:http://www.kdnuggets.com/polls/2009/data-mining-tools-used.htm

© 2010 刘思喆 @ 贝吉塔行星 Suffusion WordPress theme by Sayontan Sinha