上周在部门内部做了一个小规模的R相关培训,大致把R的整体构架和特点做了个综述。聊得非常随意,天马行空。在这里,贴出概要(下图)和大家一起分享:

(顺序是:从右至左,由上至下)

红色是重点讲的部分,当然还穿插了一些关于R的八卦:比如R和SPSS、SAS之间的故事……。我发现大家对“八卦”还是相当感兴趣的:)

 

2009年10月20日 REvolution 消息,REvolution 获得来自 North Bridge 和英特尔的 900 万美元的风险投资。最为轰动的是:SPSS 软件的创始人之一,前 SPSS 的 CEO——Norman Nie 正式成为 REvolution 的 CEO!

REvolution 是一家专注销售基于开源统计分析语言 R 开发的统计建模软件的公司,据其自身报道,REvolution 解决了 R 在多线程计算、内存使用、高性能计算等关键性问题,且提供专业的商业统计服务。注: R 也有解决此类问题的包,可参见 HighPerformanceComputing

 国内很多介绍 SPSS 的资料一般都会有提到:

20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS总部……

而这三位研究生中最主要的一位就是上面所说的 Norman Nie。Nie 从1975 至 1992 年间一直担任 SPSS 公司 CEO,而后一直担任董事会主席和软件设计顾问。

REvolution 的 David Smith 说 Norman Nie:

he is deeply passionate about making Statistics better with R.

今年 SPSS 发生了很多事,比如 SPSS 重塑金身,比如 IBM 花费 12 亿美元收购 SPSS,但我认为 Norman Nie 转向 R 社区最让人兴奋!

 

SPSS 在首页显著位置公布 An important message for our customers and partners,同 IBM 共同宣布 SPSS 被收购的 definitive agreement。这 SPSS 改名还没几天,又有了这么大的动作,BI 界不太平啊!

IBM 的 Press 里有段话很有意思:

As companies attempt to control costs and use resources more wisely, IDC estimates that the worldwide market for business analytics software will swell to $25 billion this year, growing 4% over 2008.(1)

 

5月份,KDnuggets 给出了近六个月用于实际数据挖掘(非评估)项目中使用的挖掘工具调查,共364个投票人。

DM toolkit

  1. SPSS (PA)和 SAS(BA) 没啥可说的,老牌的商业数据分析软件商,尤其是 SPSS,去年就是 KDnuggets 这项调查的第一位,SPSS 的销售常拿这个说事;
  2. Excel(spreadshit),可进行“简单数据操作”的 MS 产品;
  3. RapidMiner,比较流行的开源数据挖掘软件;
  4. R ? 为数据分析而生的开源软件。说到这儿,我突然卡壳了,它能做的事情太多……。R 更贴近于数据的本质(继续鼓吹)~~

SAS、SPSS、Statistica 陆续增加了对 R 语言的支持,从这个角度来讲,这几大厂商自己都心虚了,几年后数据挖掘领域必定是 R 的天下。

原文:http://www.kdnuggets.com/polls/2009/data-mining-tools-used.htm

 

SPSS(Statistical Product and Service Solutions) 时代终结,从此它叫做 PASW (Predictive Analytics SoftWare)。

旗下产品基本上名称也被换了个遍:

  1. SPSS Clementine —— PASW Modeler
  2. Text Mining for Clementine ——PASW Text Analytics
  3. SPSS Dimensions ——PASW Data Collection
  4. SPSS Statistics——PASW Statistics
  5. ……

最早 SPSS 是做社会统计分析的,从它最初的名称(Statistical Package for the Social Sciences)就可以看出来。不知道是经营不下去了,还是美其名曰的战略调整。

业界变化大啊,和上次 S_plus 被 TIBCO Software Inc.收购一样,我又一次“后知后觉”。

Jack Noonan, SPSS Chairman, President and CEO, said, “SPSS is the only predictive analytics vendor to deliver the depth and breadth of software to capture customer feedback, predict behaviors and then act on the results by improving business processes. With important and valued feedback from customers, we have created a new, over–arching product portfolio name that builds on our 40 year legacy of innovation, enhanced performance, and robust deployment capabilities in Predictive Analytics.”

一句话评论:华丽地抹了层金粉,里头还是泥胎!

© 2012 刘思喆 @ 贝吉塔行星 Suffusion theme by Sayontan Sinha