在2008年,第一届中国R语言会议上,来自于艾瑞咨询的张翔为大家展示了一组极具震撼力的泡泡图,而这段视频便是Hans Rosling 在2006年 TED 上的演讲,讲述的是1956年-2006年之间各国间的经济发展变化。虽然个人认为泡泡图的实现的技术并没有太多技术含量,但惊讶于Hans Rosling大智若愚的演讲能力,甚至再看完五六遍之后,仍然还会被其感染。

再后来, Hans Rosling将这款数据展示产品卖给了Google,而Google又将其整合到Visualisation API 里,于是我们可以调用Google的API来使用这些有趣的图形展示功能。

更令人鼓舞的是:前不久,Markus Gesmann, Castillo两位老大,写了googleVis这个R扩展包,将Hans Rosling的泡泡图同R语言完美的整合在了一起:)

下面就是在R语言里,通过googleVis包,对我国2006年至今的货币供应量(M0、M1、M2)Motion Chart(将横坐标设置为time以后,点击Play)

碎碎念:从泡泡的跳动上看,央行投放的货币供应量(亿元)在2009-2011年间,增加的最为剧烈,当然这个时间段也是房价近十年间增长最为迅速的两年。而现在呢,房市开始限购,国内房地产市场已经撑不住超发的货币,因此广泛的通货膨胀开始蔓延。引用郎咸平的几段话:

我们近几年发了76.5万亿的货币,是GDP的2.5倍,而美国的货币量除上GDP只是0.6,只有我们的四分之一

唯一的解释只能是货币的购买力在下降,这就是经济学里的通货膨胀

最后,关于googleVis包的使用请移步至这里

 

前些天在准备中国第三届R语言会议(上海)的时候,翻到以前记录在Google Notebook里的一些材料,一篇是关于Google Codes关于R代码的规范,非常值得借鉴。

规范这个东西平时多多注意一些还是有好处的,就和作文一样,漂亮的字体总能有不错的加分。这里就不翻译原文了,摘一些 tips 供大家参考:

1、一般性规则

  • 避免使用attach
  • 写函数是尽量少的使用stop()
  • 定义S3和S4的对象不要混在一起使用

2、文件命名

以.r结束的文件,尽可能的增加信息在文件名里面,比如

Good:

predict_ad_revenue.R

Bad:

foo.R

3、变量名和函数命名规则

# 注意,在R环境下,大小写是敏感的

变量:

Good:

avg.clicks

Bad:

avg_Clicks, avgClicks

函数名:

Good:

CalculateAvgClicks

Bad:

calculate_avg_clicks, calculateAvgClicks

4、字符间隔

这个可能是最快的,使代码外观变”漂亮”的规则了

Good:

tabPrior <- table(df[df$daysFromOpt < 0, "campaignid"])

Bad:

tabPrior<-table(df[df$daysFromOpt<0,"campaignid"])

这里包含了赋值、逻辑符号以及逗点分隔。

# 在R里面尽量少用 =

在函数里:

Good:

if (debug)

Bad:

if(debug)

5、代码组织

尤其是做项目的话,以下信息是必须有的:

  1. 版权声明
  2. 作者注释
  3. 文件说明,项目目的,输入和输出的说明
  4. source() 和 library() 说明
  5. 函数定义
  6. 其他

6、注释

养成良好的注释习惯

  • 单行注释以 # 开头,加一个空格
  • 短注释需要在代码后面空两格,然后 # ,再加一个空格

最后再一次推荐使用Emacs+ESS,虽然我已经折腾n多次了~~

永久链接:http://www.bjt.name/2010/11/google-r-code-style

 

以前就想写一篇博客,讲述 Google 给我们生活带来的便利,这不,再不写,也许再也没有机会了。

为什么说没机会了,是因为 Google 官方博客的一篇文章——A new approach to China(抱歉,因为是订阅的内容,已经被墙了,我实在不能找到链接,不过可以访问这里,中文翻译的和原文),也许真的有一天 Google 会撇下我们

说到 Google,感慨颇深。以前在人大读书的时候,受舍友影响,从来不知道有其他的搜索引擎,不论干啥,第一反应就是 Google 之。后来,Google 进入中国,正式提出”谷歌“的中文名称,当时我还笑话 Google 的中文名太傻。而现在呢,患有严重的 Google 依赖综合征,算是交代了。

www.google.com 最适宜对英文资料的搜索,很多童鞋对 google.com 和 google.cn 感觉一样,实际上是有区别的。用一句很低俗很低俗的话来说就是,google.cn 是被阉割过的 Google(虽然仍然比 baidu 好很多)。举个最简单的例子,google.cn 是没有账户信息的,也就是说,你不能通过 google.cn 来登录 Google 的服务。而且似乎在中国,在浏览器中使用 Google 会默认指向 Google 中国。再换句话说,我们一般会把 Google 认为是一个很普通的搜索引擎,但实际上如果登录 Google,会发现别有洞天。

下面我列举一些每天相伴我的,便利的 Google 服务:

资讯类:

  • Gmail:Google 的 一款优秀的 mail。还记得最早 Google 开放邮件系统,没有独立注册的地方,必须通过其他人邀请。
  • Google Reader:每天开电脑后,要做的第二件事(第一件事是 foxmail 收取 gmail)。信息需要捕捉,使用书签记录互联网信息那是 web1.0 时代,现在我们有 RSS,Google Reader 可以带领我们翻墙去学统计,sigh!不过有个问题就是,如果你恰好在某个站点看到了一个很好的文章,而上面又有一个pdf链接……点击,浏览器报告错误链接……噢,那是在墙外。哪位童鞋有好办法解决,请告之。
  • Google Group:顾名思义,是小组讨论的论坛,很多志同道合的童鞋发言交流思想的地方。比如,申请了 TopLanguageCOS R Team 等,不过我更倾向把它归为 maillist 的一种,就和 R 的Mailing Lists 一样。
  • Google Alert:Google 中国翻译成“快讯”,恰到好处。它能告诉你每天最新发生的事情,当然发生的事情是你用关键词来定义的。

办公类:

  • Google Notebook:真正意义的互联网笔记本。
  • Google Docs:美国华盛顿特区政府官方使用的办公软件。挺好的,国内不知为啥又被封掉。
  • Google Talk:非常适合办公环境的即时聊天软件,聊天记录保存在 Gmail 帐号里,支持语音功能,同时有 gmail 邮件通知。
  • Google code:直接参考 R 的 sqldf 包 http://code.google.com/p/sqldf/

网站类:

  • Google Analytics:做网站的朋友肯定对它非常熟悉。
  • Google calendar:日程,合理规划时间是成功的必要条件。
  • Google Site 和 Google pages:功能上感觉比较类似,都是用来做站点的,但都不能用了,sigh again!
  • Goolge Picasa:图片分享,也不能用了
  • Google blog:其实挺好的 blog,由于众所周知的原因,被封了(偶尔也会能上)。唯一可惜的是,上面有很多不错的统计资源。

软件类:

  • Google 输入法:拼音输入法,表现中规中矩,可以同步用户词典。
  • Goolge 浏览器:感觉和 firefox 差不多,当然远远比 Internet explore 好很多很多辈(强调一下——不是倍)。
  • Google 词霸:自从有个这个,我就不再买正版的金山词霸。配合 neospeech 的 TTS (text-to-speech),挺舒服 ^_^
  • Google Earth:这个就更不用说了吧,我能通过它找到我家屋顶。

我这里只是简单了列了一下常用的 Google 服务,像一些比如 Google 学术搜索、Google 生活搜索、地图、桌面之类的我都没有提到,但它们都在或多或少的影响着我们的生活。

还是那句话——我患有严重的 Google 依赖综合征。

© 2012 刘思喆 @ 贝吉塔行星 Suffusion theme by Sayontan Sinha