
今天在郑来秩那儿看到了一张Excel2007的绘图,用来对比实际完成情况和目标的差异,不多解释,原文请移步至这里。 数据是这样的 季度 目标 实际 中间值 差异 第一季度 320 260 290 -60 第二季度 300 280 290 -20 第三季度 350 390 370 40 第四季度 300 380 340 80 最后的图形是这样的: Excel2007不是很熟,不评论。对比R实现的结果及方式: 代码共11行,细节见这里

又是一个R不务正业的例子。 三天前,itux 在统计之都论坛上问到了如何做 Matrix67 博客上的平滑马赛克图,我是好事之徒,颠颠地跑去瞧了一眼。恩,蛮有意思的,而且非常黄,非常暴力!但比较悲剧的是我不会用Mathematica,只好用R实现了一下。 本来想标题改的彪悍一些——《一千二百个女人和我的故事》,想想还是算了吧,虽说是用了1200个漂亮女人组成了我的头像,但她们我一个也不认识,哈哈。 用的原图我就不贴了,实际上我是戴着眼镜的,马赛克平滑以后,不明显了。 最后是代码。非常简单,不到20行。大概所需要的时间:构思写代码1个小时,下载和整理图片时间长点,3个多小时(当然你本地资源和Matrix67一样丰富的话另说,哈)。
原文链接在这里 10.解不了数独游戏??用R! 9.先人一步的技能??学R!它是主流开源统计及数据分析语言,并且仍然在升温! 8.需要在你的软件应用中使用统计计算模块??部署R吧!它可以整合其他的编程语言,比如Java、Ruby、C++、Python 7.看看这些用于解决复杂问题的,可重复使用的R扩展包??用R吧!它有2000+的扩展包,涉及金融、自然语言处理、聚类、最优化、预测、高性能计算等等。 6.R可以运行在所有的平台下(是全部哦),比如Windows PC、Mac、Linux…… 5.你想知道统计多么有趣——试试R!! 4.你了解最近的趋势么?这些成功的企业,比如纽约时报、谷歌、Facebook、美洲银行(美国)、辉瑞、默克都在使用R,那你呢?? 3.需要做适合自己特点、独有的分析么??需要解决一个优化问题么??还在自己的模型里同 Excel 或 SQL 做斗争么??试试R!! 2.想弄一张迷人的图形么?试试R! 1.想得到2014年最酷的工作??学统计。在未来,数据分析师是最时髦的工作(在2018)。 10. Can’t crack that hard Sudoku problem?? Use R! 9. Want to pick a skill that will give you an early adopter advantage?? Learn R! It is the leading open source statistical and data analysis programming language, and is heating up! [...]

话说到,前段时间给某省移动公司做无线音乐交叉推荐项目,做的事不亦乐乎。且不说涉及的数据挖掘的算法,单说歌曲这玩意儿有关的一些有趣的话题,就挺让人兴奋,比如: 什么歌曲好听?能不能按照既定规则作曲,就能得到好歌? 歌曲有风格的,且风格是有限的。这个风格如何定义? 歌曲是对应歌手的,一个歌手的所有歌曲是不是对于单个听众来说都是好的? 歌手的风格有类似,那些比较相近? 这么多问题,假如有相关数据,其实都是可以通过数据挖掘的算法来给出答案的。最后一个歌手风格问题,假如能穷尽所有歌手之间的关系,没准能得到一些提示?于是乎,开始着手找数据,琢磨如何搞定这个事情。 问题有很多: 歌手的范围如何界定?是中文、英文、日文、韩文、法文等一起考虑,还是一个语种一个语种的考虑? 歌手列表如何获得? 歌手间的关系如何获得?如何衡量歌手的关系? 网上搜了一下,发现百度可以给答案,它说: 列表:http://list.mp3.baidu.com/top/top200.html 关系:搜索两两歌手的网页数即可,即可代表二者的关系强弱(假设网页数多,即关系紧密) 于是乎,就这么办了(请新建标签页浏览图片): 很有意思的结果,有几点提示: 歌手后面的颜色点是歌手的分群(同群的风格相似?) 歌手间的线代表了两者间关系强弱 前200的歌手剔除掉了《信》和《黎明》二位(这俩哥们的搜索干扰太大了) 解释的话,我这儿就省了。仁者见仁,智者见智。反正这198位歌手,我还有几十个不认识,像什么格格、小雪、大嘴巴之类的,还有什么飞轮海啥的,我的偶像集中在上个世纪,呵呵。 http://www.bjt.name/2011/05/baidu-singers-relationships/
前几天COS论坛上还在说中科大的R镜像还没弄好,今天再看cran,中科大的镜像已然可以正式使用。 中国的 R 语言镜像近几年来变化比较大,最早是东南大学,但不知道什么原因消失了。而后国内镜像主要集中在香港的geoexpat和厦门大学,再后来加入了中科院的两个所(包括CTeX),到今日加入中科大镜像。 个人一直觉得,人大作为中国R语言的倡导者,却一直没有提供镜像,挺遗憾的(人大文科氛围太浓烈)。 ———————–分割线一—————————- 关于SAS: 4月30日,dapangmao在 SAS圈子 更新了一篇博客——SAS, 一个华丽时代的结束,具体内容我就不在这里转了。不过有些奇怪的是,评论没有硝烟,不知道是因为SAS太封闭还是大家争累了。 ———————–分割线二—————————- 关于MySQL: 以前工作环境一般都是直接面对服务器上的Oracle、DB2,数据库安装、调试甚至数据源这些一般不用考虑。这两天项目需要,导了一些数据在本地。说来数据量也不大,1.5GB。一般的分析软件还不能直接搞定,于是乎倒腾上了MySQL。这个轻量级数据库挺有意思,注释和R是一样的(#),其前端工具heidisql不支持查询结果直接粘贴到word,却支持Copy selected rows as LaTeX table,大大的逗了我一下。以前我老说R和LaTeX是天然的搭档,现看来MySQL也是:)