今天在郑来秩那儿看到了一张Excel2007的绘图,用来对比实际完成情况和目标的差异,不多解释,原文请移步至这里

数据是这样的

季度 目标 实际 中间值 差异
第一季度 320 260 290 -60
第二季度 300 280 290 -20
第三季度 350 390 370 40
第四季度 300 380 340 80

最后的图形是这样的:

Excel2007不是很熟,不评论。对比R实现的结果及方式:

代码共11行,细节见这里

 

 

5月份,KDnuggets 给出了近六个月用于实际数据挖掘(非评估)项目中使用的挖掘工具调查,共364个投票人。

DM toolkit

  1. SPSS (PA)和 SAS(BA) 没啥可说的,老牌的商业数据分析软件商,尤其是 SPSS,去年就是 KDnuggets 这项调查的第一位,SPSS 的销售常拿这个说事;
  2. Excel(spreadshit),可进行“简单数据操作”的 MS 产品;
  3. RapidMiner,比较流行的开源数据挖掘软件;
  4. R ? 为数据分析而生的开源软件。说到这儿,我突然卡壳了,它能做的事情太多……。R 更贴近于数据的本质(继续鼓吹)~~

SAS、SPSS、Statistica 陆续增加了对 R 语言的支持,从这个角度来讲,这几大厂商自己都心虚了,几年后数据挖掘领域必定是 R 的天下。

原文:http://www.kdnuggets.com/polls/2009/data-mining-tools-used.htm

 

Some of the data you want to use is writen in Excel by people who only knows how to write Excel spreadshits。

© 2012 刘思喆 @ 贝吉塔行星 Suffusion theme by Sayontan Sinha