第13期KDnuggets 关于数据挖掘软件的调查结果新鲜出炉, 调查了对于过去的12个月里实际的项目过程中使用了哪些数据挖掘(分析)软件? 不出所料,底层语言使用频率最高的是依旧是R语言、SQL、Java和Python。 而从软件工具角度上看,R、Excel和RapidMiner则名列三甲(去年R排名第二),具体排名如下图:

可以看到,排名靠前的以开源软件为主,商业软件则相对靠后。造成这种现象的原因很多,其中一条比较重要的因素就是当今社会复杂的数据环境, 必须有更加灵活的软件做支持,灵活则是生命力。这个角度上看,闭源的商业软件依旧停留在上个世纪70年代batch的方式,曾经积攒的优势越来越不明显。

对于同R语言同级别的SAS而言,在这个调查下其使用流行度进一步萎缩。甚至有人估计, 2015年将是SPSS和SAS历史的终点。

其实我不太想看到这一天~~