<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>刘思喆 @ 贝吉塔行星</title>
	<atom:link href="http://www.bjt.name/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.bjt.name</link>
	<description>R 语言，数据挖掘，数据可视化</description>
	<lastBuildDate>Sat, 06 Mar 2010 00:57:50 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>北京房地产网上签约情况</title>
		<link>http://www.bjt.name/2010/03/beijing-real-estate-contracts/</link>
		<comments>http://www.bjt.name/2010/03/beijing-real-estate-contracts/#comments</comments>
		<pubDate>Thu, 04 Mar 2010 11:20:22 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[经济]]></category>
		<category><![CDATA[北京]]></category>
		<category><![CDATA[房价]]></category>
		<category><![CDATA[房地产]]></category>
		<category><![CDATA[翻墙]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10629</guid>
		<description><![CDATA[最近两会期间，房地产又一次成为焦点中的焦点，各位代表各抒己见，据说在政协的各项提案之中，关于房地产市场的提案几乎占据半壁江山。
房价涨与不涨，各位代表是各抒己见，有声音说北京房价2年内会涨到4万，而且还有佐证。当然俺们的总理最近5年一直在说这事，童鞋可移步这里，当然还有一张漫画，这里就不贴了，太不Harmany。若感兴趣可以使用 blogtd + 总理姓名 google 之（可能得翻墙出去）。
人家说啥都不如自己看看，来点实际的。关注一下最近几年北京房地产市场每天网上（期房、存量房）签约的套数。
（首先声明，房地产市场比较复杂，比如官啊、商啊、摇号啊、中介啊、银行啊、炒房团啊，空军、多军……指标忒多，所以我一直也没搞太明白。搞不明白也想凑一凑热闹，与时俱进嘛！扔两张图上来，大家笑笑）
2008年9月1日至今的期房（不包含经适房、限价房）签约情况：

其中的时点数据不包括：


2009.01.25 &#8211; 2009.02.01 春节
2009.11.02，2010.01.10，2010.01.16 调试
2010.02.13 &#8211; 2010.2.19 春节


如果只看2008年后半年，会发现其实每天签约的期房数量也不是很多，一直都在100套左右。不过在年底的时候，随着第一次楼盘降价潮的来临，部分刚需释放，期房签约的数量要明显高于平日。
假设2008年是期房市场正常年的话，那么2009年几乎可以用“疯狂”二字来标记北京的期房市场。每天平均400套的签约数量，动辄200、300万的房价，都贵成这样了，被谁买去啦？

然后是北京存量房签约情况：

（不知为何，北京房地场交易网没有2008年9月1日至2008年10月14日数据。）
存量房签约的情况大致和期房签约变化一致。同样是2008年的数量比较小，而到了2009年，市场开始癫狂。不过存量房签约套数变化有点意思:

似乎有个周期变化，猜测是人为因素；
2009年末受相关优惠政策影响，签约量的确比较生猛。

以前我一直以为大家一般都会去买期房，原来实际的情况是，这几年存量房卖的比期房要好很多。从存量房签约的数量上看，北京可售商品房数量一直在减少这也是必然的，也就应了一些媒体说的，“北京可售商品房越来越少，房子的稀缺将进一步带动房价的上涨。”
但从买卖双方博弈角度来说：可售商品房的减少，很有可能是因为大部分投机客获利，大规模离场的原因。但，可惜的是我们没有进一步数据进行分析……
最后是数据——期房，存量房。二者除了套数数据以外，还包括面积。在期房数据中包括的后两项为经适房、两限房；存量房数据分为合计、服务窗口签约、经纪机构签约、交易保证机构签约。
相关文章：

房地产泡沫？- 得瞅瞅了！

]]></description>
			<content:encoded><![CDATA[<p>最近两会期间，房地产又一次成为焦点中的焦点，各位代表各抒己见，据说在政协的各项提案之中，关于房地产市场的提案几乎占据半壁江山。</p>
<p>房价涨与不涨，各位代表是各抒己见，有声音说北京房价2年内会<a href="http://house.focus.cn/news/2010-03-05/870811.html" target="_blank">涨到4万</a>，而且还有<a href="http://news.sohu.com/20100304/n270562281.shtml" target="_blank">佐证</a>。当然俺们的总理最近5年一直在说这事，童鞋可移步<a href="http://blog.mysupa.com/journal/237014.html" target="_self">这里</a>，当然还有一张漫画，这里就不贴了，太不Harmany。若感兴趣可以使用 blogtd + 总理姓名 google 之（可能得翻墙出去）。</p>
<p>人家说啥都不如自己看看，来点实际的。关注一下最近几年北京房地产市场每天网上（期房、存量房）签约的套数。</p>
<p>（首先声明，房地产市场比较复杂，比如官啊、商啊、摇号啊、中介啊、银行啊、炒房团啊，空军、多军……指标忒多，所以我一直也没搞太明白。搞不明白也想凑一凑热闹，与时俱进嘛！扔两张图上来，大家笑笑）</p>
<p>2008年9月1日至今的期房（不包含经适房、限价房）签约情况：</p>
<p style="text-align: center;"><a href="http://www.bjt.name/wp-content/uploads/2010/03/amount1.png" target="_blank"><img class="size-full wp-image-10631 aligncenter" title="amount1" src="http://www.bjt.name/wp-content/uploads/2010/03/amount1.png" alt="" width="800" height="600" /></a></p>
<div id="_mcePaste">其中的时点数据不包括：</div>
<div>
<ol>
<li>2009.01.25 &#8211; 2009.02.01 春节</li>
<li>2009.11.02，2010.01.10，2010.01.16 调试</li>
<li>2010.02.13 &#8211; 2010.2.19 春节</li>
</ol>
</div>
<div>如果只看2008年后半年，会发现其实每天签约的期房数量也不是很多，一直都在100套左右。不过在年底的时候，随着第一次楼盘降价潮的来临，部分刚需释放，期房签约的数量要明显高于平日。</div>
<div>假设2008年是期房市场正常年的话，那么2009年几乎可以用“疯狂”二字来标记北京的期房市场。每天平均400套的签约数量，动辄200、300万的房价，都贵成这样了，被谁买去啦？</div>
<div><span id="more-10629"></span></div>
<div>然后是北京存量房签约情况：</div>
<div><a href="http://www.bjt.name/wp-content/uploads/2010/03/amount2.png"><img class="size-full wp-image-10630 aligncenter" title="amount2" src="http://www.bjt.name/wp-content/uploads/2010/03/amount2.png" alt="" width="800" height="600" /></a></div>
<p>（不知为何，北京房地场交易网没有2008年9月1日至2008年10月14日数据。）</p>
<p>存量房签约的情况大致和期房签约变化一致。同样是2008年的数量比较小，而到了2009年，市场开始癫狂。不过存量房签约套数变化有点意思:</p>
<ol>
<li>似乎有个周期变化，猜测是人为因素；</li>
<li>2009年末受相关优惠政策影响，签约量的确比较生猛。</li>
</ol>
<p>以前我一直以为大家一般都会去买期房，原来实际的情况是，这几年存量房卖的比期房要好很多。从存量房签约的数量上看，北京可售商品房数量一直在减少这也是必然的，也就应了一些媒体说的，“北京可售商品房越来越少，房子的稀缺将进一步带动房价的上涨。”</p>
<p>但从买卖双方博弈角度来说：可售商品房的减少，很有可能是因为大部分投机客获利，大规模离场的原因。但，可惜的是我们没有进一步数据进行分析……</p>
<p>最后是数据——<a href="http://www.bjt.name/wp-content/uploads/2010/03/data1.csv" target="_blank">期房</a>，<a href="http://www.bjt.name/wp-content/uploads/2010/03/data2.csv" target="_blank">存量房</a>。二者除了套数数据以外，还包括面积。在期房数据中包括的后两项为经适房、两限房；存量房数据分为合计、服务窗口签约、经纪机构签约、交易保证机构签约。<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2009/06/real-estate-bubble-data-beijing/' title='房地产泡沫？- 得瞅瞅了！'>房地产泡沫？- 得瞅瞅了！</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/03/beijing-real-estate-contracts/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>用LaTeX放大pdf文档</title>
		<link>http://www.bjt.name/2010/03/latex-pdfpages/</link>
		<comments>http://www.bjt.name/2010/03/latex-pdfpages/#comments</comments>
		<pubDate>Mon, 01 Mar 2010 01:39:48 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[LaTeX]]></category>
		<category><![CDATA[ESLII]]></category>
		<category><![CDATA[hastie]]></category>
		<category><![CDATA[pdfpages]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10560</guid>
		<description><![CDATA[2009年12月，hastie教授主页上更新了勘误后的The Elements of Statistical Learning II。这部机器学习领域的巨著，做数据挖掘或者统计分析的同行应该比较熟悉，不过这本书在美帝的 Amason 上要卖 80$，非常不符合中国特色的社会主义！
好在 Hastie 几位大牛深刻体会广大发展中国家莘莘学子的购买能力，在其主页上提供了免费的pdf版本。不过pdf版本有个小问题：排版是为了a4打印而设计的，白边太多，在电脑上看或者打印出来极为不爽。
下面提供一个解决方案来处理这个问题——使用LaTeX中的pdfpages宏包。
具体LaTeX代码参考如下：

\documentclass[a4paper,12pt]{report}
\usepackage[final]{pdfpages}
\begin{document}
\includepdf[pages=19-26, scale=1.3,
delta=0mm 5mm, frame]{ESLII_print3.pdf}
\end{document}
\endinput

使用PDF LaTeX编译。
主要参数非常简单，即从ESLII_print3.pdf中提取第19至26页（第一章），并放大1.3倍（成功剔除掉多余的白边）。
相关文章：

没有了，随便看看吧 ^_^

]]></description>
			<content:encoded><![CDATA[<p>2009年12月，hastie教授主页上更新了勘误后的The Elements of Statistical Learning II。这部机器学习领域的巨著，做数据挖掘或者统计分析的同行应该比较熟悉，不过这本书在美帝的 Amason 上要卖 80$，非常不符合中国特色的社会主义！</p>
<p>好在 Hastie 几位大牛深刻体会广大发展中国家莘莘学子的购买能力，在其<a href="http://www-stat.stanford.edu/~tibs/ElemStatLearn/">主页</a>上提供了免费的pdf版本。不过pdf版本有个小问题：排版是为了a4打印而设计的，白边太多，在电脑上看或者打印出来极为不爽。</p>
<p>下面提供一个解决方案来处理这个问题——使用LaTeX中的pdfpages宏包。<br />
具体LaTeX代码参考如下：</p>

<div class="wp_syntax"><div class="code"><pre class="latex" style="font-family:monospace;"><span style="color: #E02020; ">\</span><span style="color: #800000;">documentclass</span><span style="color: #E02020; ">[</span><span style="color: #C08020; font-weight: normal;">a4paper,12pt</span><span style="color: #E02020; ">]{</span><span style="color: #2020C0; font-weight: normal;">report</span><span style="color: #E02020; ">}</span>
<span style="color: #E02020; ">\</span><span style="color: #800000;">usepackage</span><span style="color: #E02020; ">[</span><span style="color: #C08020; font-weight: normal;">final</span><span style="color: #E02020; ">]{</span><span style="color: #2020C0; font-weight: normal;">pdfpages</span><span style="color: #E02020; ">}</span>
<span style="color: #C00000; font-weight: normal;">\begin</span><span style="color: #E02020; ">{</span><span style="color: #2020C0; font-weight: normal;"><span style="color: #0000D0; font-weight: normal;">document</span></span><span style="color: #E02020; ">}</span>
<span style="color: #800000; font-weight: normal;">\includepdf</span><span style="color: #E02020; ">[</span><span style="color: #C08020; font-weight: normal;">pages=19-26, scale=1.3,
delta=0mm 5mm, frame</span><span style="color: #E02020; ">]{</span><span style="color: #2020C0; font-weight: normal;">ESLII_print3.pdf</span><span style="color: #E02020; ">}</span>
<span style="color: #C00000; font-weight: normal;">\end</span><span style="color: #E02020; ">{</span><span style="color: #2020C0; font-weight: normal;"><span style="color: #0000D0; font-weight: normal;">document</span></span><span style="color: #E02020; ">}</span>
<span style="color: #800000; font-weight: normal;">\endinput</span></pre></div></div>

<p>使用PDF LaTeX编译。<br />
主要参数非常简单，即从ESLII_print3.pdf中提取第19至26页（第一章），并放大1.3倍（成功剔除掉多余的白边）。<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li>没有了，随便看看吧 ^_^</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/03/latex-pdfpages/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>最近一周中国及周边版图地震情况</title>
		<link>http://www.bjt.name/2010/01/chinese-earthquake-visualization/</link>
		<comments>http://www.bjt.name/2010/01/chinese-earthquake-visualization/#comments</comments>
		<pubDate>Tue, 26 Jan 2010 15:42:09 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[图型展示]]></category>
		<category><![CDATA[earth quake]]></category>
		<category><![CDATA[唐山]]></category>
		<category><![CDATA[地震]]></category>
		<category><![CDATA[运城]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10561</guid>
		<description><![CDATA[大自然的力量永远让人敬畏，地震、海啸、陨石、雷击……因为我们在大自然的面前如此渺小，所以我们必须协作，必须发展科技，必须懂统计 ：）
说到地震，我可能比较敏感，因为我是唐山人。虽然 76 年唐山大地震时，我还没有形成碳水化合物形态，但后来，每每听到老一辈讲起当时的惨烈，心常戚戚。
讲几则作为唐山人的小故事：

小时候对地震的初相识：有一次刚刚从床上爬起来，正在懒洋洋的坐着穿衣服，就发觉床开始做规则的前后晃动。当时年龄小，很无知，只知道傻乎乎地沉浸在如秋千般的跳动中，那叫个带劲……
有一次上课，感觉课桌在晃动，没法看书，于是停下来查看周围哪个同学在晃。检查一圈发现周围几个同学没有一个再晃！结果，紧张地直接拍案而起，大呼——地震啦（事后新闻证明是真的）！在我们那儿，这点比较好：即使是课上误判地震的这种事儿，一般老师都是笑笑而过 ；）
每年我们那都会有地震的谣言，而且说的神乎其神，俺老爸一般会守夜（感谢俺老爸！）。或者天气好的话，干脆去广场之类空旷的地方，找地方打地铺。当然一般都是打牌、聊天到 24 点，然后回家睡觉。

恩，不多扯了，言归正传。自从汶川大地震以后，国人对地震明显敏感很多。且不说海地，单单前两天（24日）山西河津、运城地震就让然琢磨不懂：有人说，21日山西省地震局辟谣称不会有地震，但运城震感明显。为什么地震局会出来辟谣，仔细一读，原来才知——地震局指的是“破坏性”地震。
但有个问题：
国务院1995年颁布的《破坏性地震应急条例》，破坏性地震指“造成一定数量的人员伤亡和经济损失的地震事件”，
并没有规定特定的级数。
这破坏级地震可不是闹着玩的，得仔细瞧瞧最近这地震都发生在哪里了，震级多大？是不是会对我们构成威胁！？于是有了下面这张图——最近一周中国及周边版图地震情况（1月20日至1月25日共计六天）：

数据童鞋们可以在这里查看，里面的震级需要注意一下，有Ms和ML两种，换算关系如下。但具体什么意思大家直接 wiki 好了。
ml=(1.17mb+0．67)/1.13
ml=(ms+1.08)/1.13
一些说明（不是写商业报告，偷工减料啦）：
蓝色的背景是地震点的密度——也许是喜马拉雅造山运动，也许是三峡工程，不管怎样，四川地区不太平啊！弟兄们小心！
红色的点代表地震的位置，其大小表示震级的大小。
从1月20日至1月25日，版图周边共计有901条地震记录（有点吓人）！其中大于ML5级的一共两次：
2010-01-24  10:36:13.8       35.45   110.70       15 Ms4.8  天然地震        山西河津
2010-01-21  10:02:02.8       13.70   125.85       33 Ms5.1  天然地震  菲律宾群岛地区
最后我们再回头看一下，最近一周地震的震级（ML）分布：
至少可以长舒一口气，原来大部分都是小震，不具“破坏性”的居多。
相关文章：

没有了，随便看看吧 ^_^

]]></description>
			<content:encoded><![CDATA[<p>大自然的力量永远让人敬畏，<a href="http://en.wikipedia.org/wiki/Earth_quake" target="_blank">地震</a>、海啸、<a href="http://www.bjt.name/2009/06/france-flight-poisson/" target="_blank">陨石</a>、雷击……因为我们在大自然的面前如此渺小，所以我们必须协作，必须发展科技，必须懂统计 ：）</p>
<p>说到地震，我可能比较敏感，因为我是唐山人。虽然 76 年唐山大地震时，我还没有形成碳水化合物形态，但后来，每每听到老一辈讲起当时的惨烈，心常戚戚。</p>
<p>讲几则作为唐山人的小故事：</p>
<ol>
<li>小时候对地震的初相识：有一次刚刚从床上爬起来，正在懒洋洋的坐着穿衣服，就发觉床开始做规则的前后晃动。当时年龄小，很无知，只知道傻乎乎地沉浸在如秋千般的跳动中，那叫个带劲……</li>
<li>有一次上课，感觉课桌在晃动，没法看书，于是停下来查看周围哪个同学在晃。检查一圈发现周围几个同学没有一个再晃！结果，紧张地直接拍案而起，大呼——地震啦（事后新闻证明是真的）！在我们那儿，这点比较好：即使是课上误判地震的这种事儿，一般老师都是笑笑而过 ；）</li>
<li>每年我们那都会有地震的谣言，而且说的神乎其神，俺老爸一般会守夜（感谢俺老爸！）。或者天气好的话，干脆去广场之类空旷的地方，找地方打地铺。当然一般都是打牌、聊天到 24 点，然后回家睡觉。</li>
</ol>
<p>恩，不多扯了，言归正传。自从汶川大地震以后，国人对地震明显敏感很多。且不说海地，单单前两天（24日）山西河津、运城地震就让然琢磨不懂：有人说，<a href="http://blog.sina.com.cn/s/blog_5e9f35ea0100gl1w.html" target="_blank">21日山西省地震局辟谣称不会有地震</a>，但运城震感明显。为什么地震局会出来辟谣，仔细一读，原来才知——地震局指的是“破坏性”地震。</p>
<p>但有个问题：</p>
<pre>国务院1995年颁布的《破坏性地震应急条例》，破坏性地震指“造成一定数量的人员伤亡和经济损失的地震事件”，
并没有规定特定的级数。</pre>
<p>这破坏级地震可不是闹着玩的，得仔细瞧瞧最近这地震都发生在哪里了，震级多大？是不是会对我们构成威胁！？于是有了下面这张图——最近一周中国及周边版图地震情况（1月20日至1月25日共计六天）：</p>
<p><a href="http://www.bjt.name/wp-content/uploads/2010/01/earthquake.png"><img class="aligncenter size-full wp-image-10562" title="earthquake" src="http://www.bjt.name/wp-content/uploads/2010/01/earthquake.png" alt="" width="730" height="653" /></a></p>
<p>数据童鞋们可以在<a href="http://data.earthquake.cn/datashare/globeEarthquake_csn.jsp" target="_blank">这里</a>查看，里面的震级需要注意一下，有Ms和ML两种，换算关系如下。但具体什么意思大家直接 wiki 好了。</p>
<pre>ml=(1.17mb+0．67)/1.13
ml=(ms+1.08)/1.13</pre>
<p>一些说明（不是写商业报告，偷工减料啦）：</p>
<p>蓝色的背景是地震点的密度——也许是喜马拉雅造山运动，也许是三峡工程，不管怎样，四川地区不太平啊！弟兄们小心！</p>
<p>红色的点代表地震的位置，其大小表示震级的大小。</p>
<p>从1月20日至1月25日，版图周边共计有901条地震记录（有点吓人）！其中大于ML5级的一共两次：</p>
<p>2010-01-24  10:36:13.8       35.45   110.70       15 Ms4.8  天然地震        山西河津<br />
2010-01-21  10:02:02.8       13.70   125.85       33 Ms5.1  天然地震  菲律宾群岛地区</p>
<p>最后我们再回头看一下，最近一周地震的震级（ML）分布：</p>
<p><a href="http://www.bjt.name/wp-content/uploads/2010/01/hist_earth.png"><img class="aligncenter size-medium wp-image-10565" title="hist_earth" src="http://www.bjt.name/wp-content/uploads/2010/01/hist_earth-300x271.png" alt="" width="300" height="271" /></a>至少可以长舒一口气，原来大部分都是小震，不具“破坏性”的居多。<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li>没有了，随便看看吧 ^_^</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/01/chinese-earthquake-visualization/feed/</wfw:commentRss>
		<slash:comments>9</slash:comments>
		</item>
		<item>
		<title>NBA联盟50位顶级球员的指标表现</title>
		<link>http://www.bjt.name/2010/01/nba-top-50-scorers-performance/</link>
		<comments>http://www.bjt.name/2010/01/nba-top-50-scorers-performance/#comments</comments>
		<pubDate>Thu, 21 Jan 2010 16:32:58 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[图型展示]]></category>
		<category><![CDATA[篮球]]></category>
		<category><![CDATA[flowingdata]]></category>
		<category><![CDATA[heatmap]]></category>
		<category><![CDATA[nba]]></category>
		<category><![CDATA[yaoming]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10539</guid>
		<description><![CDATA[有点标题党的嫌疑，实际是介绍如何使用 R 绘制 heatmap 的文章。
今天无意间在Flowingdata看到一篇关于如何使用 R 来做 heatmap 的文章（请移步到这里）。虽然 heatmap 只是 R 中一个很普通的图形函数，但这个例子使用了2008-2009赛季 NBA 50个顶级球员数据做了一个极佳的演示，效果非常不错。对 R 大致了解的童鞋可以直接在 R console 上敲
？heatmap
直接查看帮助即可。
没有接触过 R 的童鞋继续围观，下面会仔细介绍如何使用 R 实现 NBA 50位顶级球员指标表现热图：
关于 heatmap，中文一般翻译为“热图”，其统计意义wiki上解释的很清楚：
A heat map is a graphical representation of data where the values taken by a variable in a two-dimensional map are represented as colors.Heat maps originated in 2D displays <a href='http://www.bjt.name/2010/01/nba-top-50-scorers-performance/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>有点标题党的嫌疑，实际是介绍如何使用 R 绘制 heatmap 的文章。</p>
<p>今天无意间在<a href="http://flowingdata.com/about/" target="_blank">Flowingdata</a>看到一篇关于如何使用 R 来做 heatmap 的文章（请移步到<a href="http://flowingdata.com/2010/01/21/how-to-make-a-heatmap-a-quick-and-easy-solution/" target="_blank">这里</a>）。虽然 heatmap 只是 R 中一个很普通的图形函数，但这个例子使用了2008-2009赛季 NBA 50个顶级球员数据做了一个极佳的演示，效果非常不错。对 R 大致了解的童鞋可以直接在 R console 上敲</p>
<p><strong>？heatmap</strong></p>
<p>直接查看帮助即可。</p>
<p>没有接触过 R 的童鞋继续围观，下面会仔细介绍如何使用 R 实现 NBA 50位顶级球员指标表现热图：</p>
<p>关于 heatmap，中文一般翻译为“热图”，其统计意义<a href="http://en.wikipedia.org/wiki/Heatmap" target="_blank">wiki</a>上解释的很清楚：</p>
<blockquote><p>A <strong>heat map</strong> is a graphical representation of data where the values taken by a <a title="Variable (mathematics)" href="http://en.wikipedia.org/wiki/Variable_%28mathematics%29">variable</a> in a two-dimensional map are represented as colors.Heat maps originated in 2D displays of the values in a data matrix. Larger values were represented by small dark gray or black squares (pixels) and smaller values by lighter squares.</p></blockquote>
<p>下面这个图即是<a href="http://flowingdata.com/about/" target="_blank">Flowingdata</a>用一些 <a href="http://www.r-project.org" target="_blank">R</a> 函数对2008-2009 赛季NBA 50名顶级球员指标做的一个热图（点击参看<a href="http://www.bjt.name/wp-content/uploads/2010/01/heatmap1.png" target="_blank">大图</a>）：</p>
<p style="text-align: center;"><a href="http://www.bjt.name/wp-content/uploads/2010/01/heatmap1.png"></a></p>
<p style="text-align: center;"><a href="http://www.bjt.name/wp-content/uploads/2010/01/heatmap1.png"><img class="aligncenter size-medium wp-image-10542" title="heatmap1" src="http://www.bjt.name/wp-content/uploads/2010/01/heatmap1-300x289.png" alt="" width="300" height="289" /></a></p>
<p><strong>先解释一下数据：</strong></p>
<p>这里共列举了50位球员，估计爱好篮球的童鞋对上图右边的每个名字都会耳熟能详。这些球员每个人会有19个指标，包括打了几场球（G)、上场几分钟（MIN)、得分（PTS)……这样就行成了一个50行×19列的矩阵。但问题是，数据有些多，需要使用一种比较好的办法来展示，So it comes, heatmap!</p>
<p><strong>简单的说明：</strong></p>
<p>比如从上面的热图上观察得分前3名（Wade、James、Bryant）PTS、FGM、FGA比较高，但Bryant的FTM、FTA和前两者就差一些；Wade在这三人中STL是佼佼者；而James的DRB和TRB又比其他两人好一些……</p>
<p>姚明的3PP（3 Points Percentage）这条数据很有意思，非常出色！仔细查了一下这个数值，居然是100%。仔细回想一下，似乎那个赛季姚明好像投过一个3分，并且中了，然后再也没有3p。这样本可真够小的！</p>
<p><strong>最后是如何做这个热图（做了些许修改）：</strong></p>
<p><span style="color: #993366;">Step 0. Download R</span></p>
<p>R 官网：<a href="http://www.r-project.org">http://www.r-project.org</a>，它是免费的。官网上面提供了Windows,Mac,Linux版本（或源代码）的R程序。</p>
<p><span style="color: #993366;">Step 1. Load the data</span></p>
<p>R 可以支持网络路径，使用读取csv文件的函数read.csv。</p>
<p>读取数据就这么简单：</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;"><span style="color: #0000FF; font-weight: bold;">read.<span style="">csv</span></span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;http://datasets.flowingdata.com/ppg2008.csv&quot;</span>, sep<span style="color: #080;">=</span><span style="color: #ff0000;">&quot;,&quot;</span><span style="color: #080;">&#41;</span></pre></div></div>

<p><span style="color: #993366;">Step 2. Sort data</span></p>
<p>按照球员得分，将球员从小到大排序：</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;">nba <span style="color: #080;">&lt;-</span> nba<span style="color: #080;">&#91;</span><span style="color: #0000FF; font-weight: bold;">order</span><span style="color: #080;">&#40;</span>nba$PTS<span style="color: #080;">&#41;</span>,<span style="color: #080;">&#93;</span></pre></div></div>

<p><code>当然也可以选择MIN,BLK,STL之类指标</code></p>
<p><span style="color: #993366;">Step 3. Prepare data</span></p>
<p>把行号换成行名（球员名称）：</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;"><span style="color: #0000FF; font-weight: bold;">row.<span style="">names</span></span><span style="color: #080;">&#40;</span>nba<span style="color: #080;">&#41;</span> <span style="color: #080;">&lt;-</span> nba$Name</pre></div></div>

<p><code>去掉第一列行号：</code></p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;">nba <span style="color: #080;">&lt;-</span> nba<span style="color: #080;">&#91;</span>,<span style="color: #ff0000;">2</span><span style="color: #080;">:</span><span style="color: #ff0000;">20</span><span style="color: #080;">&#93;</span> <span style="color: #228B22;"># or nba &lt;- nba[,-1]</span></pre></div></div>

<p><span style="color: #993366;">Step 4. Prepare data, again</span></p>
<p>把 data frame 转化为我们需要的矩阵格式：</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;">nba_matrix <span style="color: #080;">&lt;-</span> <span style="color: #0000FF; font-weight: bold;">data.<span style="">matrix</span></span><span style="color: #080;">&#40;</span>nba<span style="color: #080;">&#41;</span></pre></div></div>

<p><span style="color: #993366;">Step 5. Make a heatmap</span></p>
<p># R 的默认还会在图的左边和上边绘制 dendrogram，使用Rowv=NA, Colv=NA去掉</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;"><span style="color: #0000FF; font-weight: bold;">heatmap</span><span style="color: #080;">&#40;</span>nba_matrix, Rowv<span style="color: #080;">=</span>NA, Colv<span style="color: #080;">=</span>NA, <span style="color: #0000FF; font-weight: bold;">col</span><span style="color: #080;">=</span><span style="color: #0000FF; font-weight: bold;">cm.<span style="">colors</span></span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">256</span><span style="color: #080;">&#41;</span>, revC<span style="color: #080;">=</span>FALSE, <span style="color: #0000FF; font-weight: bold;">scale</span><span style="color: #080;">=</span><span style="color: #ff0000;">'column'</span><span style="color: #080;">&#41;</span></pre></div></div>

<p><code>这样就得到了上面的那张热图。</code></p>
<p><span style="color: #993366;">Step 6. Color selection</span></p>
<p>或者想把热图中的颜色换一下：</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;"><span style="color: #0000FF; font-weight: bold;">heatmap</span><span style="color: #080;">&#40;</span>nba_matrix, Rowv<span style="color: #080;">=</span>NA, Colv<span style="color: #080;">=</span>NA, <span style="color: #0000FF; font-weight: bold;">col</span><span style="color: #080;">=</span><span style="color: #0000FF; font-weight: bold;">heat.<span style="">colors</span></span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">256</span><span style="color: #080;">&#41;</span>, revC<span style="color: #080;">=</span>FALSE, <span style="color: #0000FF; font-weight: bold;">scale</span><span style="color: #080;">=</span><span style="color: #ff0000;">&quot;column&quot;</span>, margins<span style="color: #080;">=</span><span style="color: #0000FF; font-weight: bold;">c</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">5</span>,<span style="color: #ff0000;">10</span><span style="color: #080;">&#41;</span><span style="color: #080;">&#41;</span></pre></div></div>

<p><code><strong>延伸阅读：</strong></code></p>
<p><code>来自于kerimcan和<a href="http://periscopic.com/">krees</a>这些人的讨论：</code></p>
<p><code><strong><a rel="nofollow" href="http://sekhon.polisci.berkeley.edu/stats/html/heatmap.html">http://sekhon.polisci.berkeley.edu/stats/html/heatmap.html</a><br />
<a rel="nofollow" href="http://enotacoes.wordpress.com/2007/11/16/easy-guide-to-drawing-heat-maps-to-pdf-with-r-with-color-key/">http://enotacoes.wordpress.com/2007/11/16/easy-guide-to-drawing-heat-maps-to-pdf-with-r-with-color-key/</a></strong></code></p>
<p><strong>补充：</strong></p>
<p>早上起来发现 David Smith 同样更新了<a href="http://blog.revolution-computing.com/2010/01/how-to-make-a-heat-map-in-r.html" target="_blank">博客</a>。唉，这厮嗅觉也忒灵敏！哈哈<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2009/03/%e4%bb%8e%e6%95%b0%e6%8d%ae%e7%9c%8b2008-2009%e8%b5%9b%e5%ad%a3%e7%9a%84%e7%81%ab%e7%ae%ad%e9%98%9f/' title='从数据看2008-2009赛季的火箭队'>从数据看2008-2009赛季的火箭队</a></li>
<li><a href='http://www.bjt.name/2010/01/rockets-heat-assists-network/' title='火箭对热火比赛（20100116）中，火箭球员的助攻网络关系'>火箭对热火比赛（20100116）中，火箭球员的助攻网络关系</a></li>
<li><a href='http://www.bjt.name/2009/04/hou-vs-lal-fieldgoal%ef%bc%89/' title='投篮点和命中率（2009-04-04 HOU vs. LAL）'>投篮点和命中率（2009-04-04 HOU vs. LAL）</a></li>
<li><a href='http://www.bjt.name/2009/02/article-zhang/' title='信陵*张公子'>信陵*张公子</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/01/nba-top-50-scorers-performance/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>火箭对热火比赛（20100116）中，火箭球员的助攻网络关系</title>
		<link>http://www.bjt.name/2010/01/rockets-heat-assists-network/</link>
		<comments>http://www.bjt.name/2010/01/rockets-heat-assists-network/#comments</comments>
		<pubDate>Sat, 16 Jan 2010 15:01:09 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[数据挖掘]]></category>
		<category><![CDATA[篮球]]></category>
		<category><![CDATA[networks]]></category>
		<category><![CDATA[rockets]]></category>
		<category><![CDATA[sna]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10517</guid>
		<description><![CDATA[本场比赛前7分钟火箭发挥还不错，最高取得了10分的领先（11-21），但受上一场力拼森林狼三个加时影响，火箭诸将体能逐渐不支，慢慢失去优势。虽然巴丁格整场替补发挥出色，无奈，随着阿里扎上篮不进，比分定格在了115-106。
相比热火发烫的53.6%投篮命中率，火箭发挥比较正常，48.7%。火箭唯一问题出现在了失误方面，8-15，如果火箭失误控制的好，也许结果可能是另外一个结果。
比赛过程中，杨毅提到（大致意思）：由于没有超级球星，火箭必须比其他球队付出更多的努力才能获得胜利，也就是说其他球队会从容地为季后赛调整状态。火箭没有这个资本，为了常规赛的成绩，火箭进入疲劳期的时间要更早。要保证后面的球队成绩，要么莫雷尽最大能力交易，补充火箭；要么阿德尔曼通过更加合理细致的轮转，让每个核心球员得到充分休息。
问题来了：在不改变现有火箭球员结构的前提下，火箭的战术轮转体系中，球员的位置如何？
引子：
本场比赛火箭一共20个助攻，Brooks 和 Battier 分别助攻了最高的5个和4个。每次助攻都会涉及两位球员，那么本场比赛所有助攻结果综合在一起，即我们将助攻者和被助攻者之间的关系使用社会网络关系表现出来，会有一些有趣的现象：

注释：
箭头方向是助攻方向，比如最下面的是 Shane Battier 给 Chuck Hayes 的助攻。
整理几个重要的关键点来评论一下：

Brooks 无疑是比赛的发起者，我们发现他的助攻几乎包括了中锋、前锋位置的所有人（但不包括阿里扎，好像我记得有个镜头阿里扎要球，Brooks 没有理会）。
Battier 既是助攻的受益者，又是助攻的发起者。个人一直比较喜欢的球员，篮球智商非常高。
Budinger 这场比赛发挥出色，同队友给予其的帮助分不开。我们看到很多个球员对其都有直接帮助。
Andersen 从助攻网络关系角度看，属于一个策应型中锋，而且是由里向外策应的那类。从比赛中观察，似乎球风有些偏软（本赛季我第一次看直播比赛 ^_^）
Ariza 接受的助攻并不多，只有 Battier 的一次，其他都是给别人的助攻，和 Brooks 一样，属于个人能力比较强，擅于自己创造得分机会的球员。

假如：
我是教练组成员，我提议（单从本场比赛结果看）：

Brooks、Battier、Ariza、Andersen 在火箭进攻体系中位置比较重要，轮转的时候尽量保证其中的两人或三人同时在场。
Budinger 属于绝好的替补球员，但似乎不适合同 Battier、Hayes 同时在场。
Lowry 在组织进攻方面能力欠佳，使用上须谨慎。

更新分割:
40场比赛助攻数据同时考虑，结果有些凌乱：

注：这个赛季火箭队有一些球员实际上并没有真正的进入轮转，比如&#8221;Tracy McGrady&#8221;,&#8221;Mike Harris&#8221;,&#8221;Jermaine Taylor&#8221;,&#8221;Pops Mensah-Bonsu&#8221;,&#8221;Brian Cook&#8221;。虽然有些球员（比如麦蒂）的确对球队的（被）助攻仍有帮助，但贡献非常有限。出于结果整洁性的考虑，上图已将这些球员因素剔除。
由于绘图算法使用的是 Force-based_algorithms，也就是说这种算法做出的图，边（edges）会尽可能的少。解释为，对球员关系的影响就是：
同其他球员关系比较多的球员将绘制的比较靠近中心，而关系较少的球员会绘制在相对靠外的位置。
重新观察火箭队助攻网络图，发现：
1月16日对热火比赛中，Kyle Lowry 和 Trevor Ariza 发挥的确出了问题，尤其是 Lowry 这点上。
如果我们求解这个网络中各个球员的 page rank 值，可以认为是每个球员同其他球员助攻的关键程度。




 Name
 PageRank


1
Aaron Brooks
0.1690


2
Trevor Ariza
0.1496


5
Luis Scola
0.1334


3
Kyle Lowry
0.1268


7
Shane Battier
0.1099


8
Carl Landry
0.0966


9
Chase Budinger
0.0741


4
Chuck Hayes
0.0724


6
David Andersen
0.0681



Brooks、Ariza、Scola、Lowry、Battier 在助攻重要性角度上，占据球队的前五位。如何使用“田忌赛马”的策略制胜，则是教练组的问题。
让我欣慰的是 Hayes <a href='http://www.bjt.name/2010/01/rockets-heat-assists-network/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>本场比赛前7分钟火箭发挥还不错，最高取得了10分的领先（11-21），但受上一场力拼森林狼三个加时影响，火箭诸将体能逐渐不支，慢慢失去优势。虽然巴丁格整场替补发挥出色，无奈，随着阿里扎上篮不进，比分定格在了115-106。</p>
<p>相比热火发烫的53.6%投篮命中率，火箭发挥比较正常，48.7%。火箭唯一问题出现在了失误方面，8-15，如果火箭失误控制的好，也许结果可能是另外一个结果。</p>
<p>比赛过程中，杨毅提到（大致意思）：由于没有超级球星，火箭必须比其他球队付出更多的努力才能获得胜利，也就是说其他球队会从容地为季后赛调整状态。火箭没有这个资本，为了常规赛的成绩，火箭进入疲劳期的时间要更早。要保证后面的球队成绩，要么莫雷尽最大能力交易，补充火箭；要么阿德尔曼通过更加合理细致的轮转，让每个核心球员得到充分休息。</p>
<p>问题来了：在不改变现有火箭球员结构的前提下，火箭的战术轮转体系中，球员的位置如何？</p>
<p>引子：</p>
<p>本场比赛火箭一共20个助攻，Brooks 和 Battier 分别助攻了最高的5个和4个。每次助攻都会涉及两位球员，那么本场比赛所有助攻结果综合在一起，即我们将助攻者和被助攻者之间的关系使用社会网络关系表现出来，会有一些有趣的现象：</p>
<p><a href="http://www.bjt.name/wp-content/uploads/2010/01/hou.png"><img class="aligncenter size-full wp-image-10516" title="hou" src="http://www.bjt.name/wp-content/uploads/2010/01/hou.png" alt="" width="485" height="449" /></a></p>
<p>注释：</p>
<p>箭头方向是助攻方向，比如最下面的是 Shane Battier 给 Chuck Hayes 的助攻。</p>
<p>整理几个重要的关键点来评论一下：</p>
<ol>
<li>Brooks 无疑是比赛的发起者，我们发现他的助攻几乎包括了中锋、前锋位置的所有人（但不包括阿里扎，好像我记得有个镜头阿里扎要球，Brooks 没有理会）。</li>
<li>Battier 既是助攻的受益者，又是助攻的发起者。个人一直比较喜欢的球员，篮球智商非常高。</li>
<li>Budinger 这场比赛发挥出色，同队友给予其的帮助分不开。我们看到很多个球员对其都有直接帮助。</li>
<li>Andersen 从助攻网络关系角度看，属于一个策应型中锋，而且是由里向外策应的那类。从比赛中观察，似乎球风有些偏软（本赛季我第一次看直播比赛 ^_^）</li>
<li><span style="text-decoration: line-through;">Ariza 接受的助攻并不多，只有 Battier 的一次，其他都是给别人的助攻，和 Brooks 一样，属于个人能力比较强，擅于自己创造得分机会的球员。</span></li>
</ol>
<p>假如：</p>
<p>我是教练组成员，我提议（单从本场比赛结果看）：</p>
<ol>
<li>Brooks、Battier、Ariza、Andersen 在火箭进攻体系中位置比较重要，轮转的时候尽量保证其中的两人或三人同时在场。</li>
<li>Budinger 属于绝好的替补球员，但似乎不适合同 Battier、Hayes 同时在场。</li>
<li><span style="text-decoration: line-through;">Lowry 在组织进攻方面能力欠佳，使用上须谨慎。</span></li>
</ol>
<p>更新分割:</p>
<hr />40场比赛助攻数据同时考虑，结果有些凌乱：</p>
<p><span style="text-decoration: line-through;"><a href="http://www.bjt.name/wp-content/uploads/2010/01/hou40.png"><img class="aligncenter size-full wp-image-10529" title="hou40" src="http://www.bjt.name/wp-content/uploads/2010/01/hou40.png" alt="" width="525" height="465" /></a></span></p>
<p>注：这个赛季火箭队有一些球员实际上并没有真正的进入轮转，比如&#8221;Tracy McGrady&#8221;,&#8221;Mike Harris&#8221;,&#8221;Jermaine Taylor&#8221;,&#8221;Pops Mensah-Bonsu&#8221;,&#8221;Brian Cook&#8221;。虽然有些球员（比如麦蒂）的确对球队的（被）助攻仍有帮助，但贡献非常有限。出于结果整洁性的考虑，上图已将这些球员因素剔除。</p>
<p>由于绘图算法使用的是 <a href="http://en.wikipedia.org/wiki/Force-based_algorithms" target="_blank">Force-based_algorithms</a>，也就是说这种算法做出的图，边（edges）会尽可能的少。解释为，对球员关系的影响就是：</p>
<p><strong>同其他球员关系比较多的球员将绘制的比较靠近中心，而关系较少的球员会绘制在相对靠外的位置。</strong></p>
<p>重新观察火箭队助攻网络图，发现：</p>
<p>1月16日对热火比赛中，Kyle Lowry 和 Trevor Ariza 发挥的确出了问题，尤其是 Lowry 这点上。</p>
<p>如果我们求解这个网络中各个球员的<a href="http://en.wikipedia.org/wiki/Page_rank" target="_blank"> page rank</a> 值，可以认为是每个球员同其他球员助攻的关键程度。</p>
<table border="1">
<tbody>
<tr>
<th></th>
<th> Name</th>
<th> PageRank</th>
</tr>
<tr>
<td align="right">1</td>
<td>Aaron Brooks</td>
<td align="right">0.1690</td>
</tr>
<tr>
<td align="right">2</td>
<td>Trevor Ariza</td>
<td align="right">0.1496</td>
</tr>
<tr>
<td align="right">5</td>
<td>Luis Scola</td>
<td align="right">0.1334</td>
</tr>
<tr>
<td align="right">3</td>
<td>Kyle Lowry</td>
<td align="right">0.1268</td>
</tr>
<tr>
<td align="right">7</td>
<td>Shane Battier</td>
<td align="right">0.1099</td>
</tr>
<tr>
<td align="right">8</td>
<td>Carl Landry</td>
<td align="right">0.0966</td>
</tr>
<tr>
<td align="right">9</td>
<td>Chase Budinger</td>
<td align="right">0.0741</td>
</tr>
<tr>
<td align="right">4</td>
<td>Chuck Hayes</td>
<td align="right">0.0724</td>
</tr>
<tr>
<td align="right">6</td>
<td>David Andersen</td>
<td align="right">0.0681</td>
</tr>
</tbody>
</table>
<p>Brooks、Ariza、Scola、Lowry、Battier 在助攻重要性角度上，占据球队的前五位。如何使用“田忌赛马”的策略制胜，则是教练组的问题。</p>
<p>让我欣慰的是 Hayes 的重要程度要比 Andersen 要好，单单从上一场比赛上看，Andersen 发挥的有些超常。</p>
<p>P.S. 维基百科上没有区别 “有向网络”和“无向网络”的 page rank ，上个表中的 page rank 值属于“无向网络”值，同上面的图略有区别（有向网络中，Lowry 的关键性仅比 Hayes 高，有些无奈）。<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2009/03/%e4%bb%8e%e6%95%b0%e6%8d%ae%e7%9c%8b2008-2009%e8%b5%9b%e5%ad%a3%e7%9a%84%e7%81%ab%e7%ae%ad%e9%98%9f/' title='从数据看2008-2009赛季的火箭队'>从数据看2008-2009赛季的火箭队</a></li>
<li><a href='http://www.bjt.name/2009/04/hou-vs-lal-fieldgoal%ef%bc%89/' title='投篮点和命中率（2009-04-04 HOU vs. LAL）'>投篮点和命中率（2009-04-04 HOU vs. LAL）</a></li>
<li><a href='http://www.bjt.name/2010/01/nba-top-50-scorers-performance/' title='NBA联盟50位顶级球员的指标表现'>NBA联盟50位顶级球员的指标表现</a></li>
<li><a href='http://www.bjt.name/2009/09/package-networks/' title='数量庞大的包，复杂的网络'>数量庞大的包，复杂的网络</a></li>
<li><a href='http://www.bjt.name/2008/07/%e5%a4%8d%e6%9d%82%e7%9a%84%e5%85%b3%e7%b3%bb%e5%9b%be/' title='复杂的关系图'>复杂的关系图</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/01/rockets-heat-assists-network/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google，其实不想走</title>
		<link>http://www.bjt.name/2010/01/google-say-goodbye/</link>
		<comments>http://www.bjt.name/2010/01/google-say-goodbye/#comments</comments>
		<pubDate>Wed, 13 Jan 2010 16:15:06 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[互联网]]></category>
		<category><![CDATA[baidu]]></category>
		<category><![CDATA[gmail]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[tts]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10504</guid>
		<description><![CDATA[以前就想写一篇博客，讲述 Google 给我们生活带来的便利，这不，再不写，也许再也没有机会了。
为什么说没机会了，是因为 Google 官方博客的一篇文章——A new approach to China（抱歉，因为是订阅的内容，已经被墙了，我实在不能找到链接，不过可以访问这里，中文翻译的和原文），也许真的有一天 Google 会撇下我们。
说到 Google，感慨颇深。以前在人大读书的时候，受舍友影响，从来不知道有其他的搜索引擎，不论干啥，第一反应就是 Google 之。后来，Google 进入中国，正式提出”谷歌“的中文名称，当时我还笑话 Google 的中文名太傻。而现在呢，患有严重的 Google 依赖综合征，算是交代了。
www.google.com 最适宜对英文资料的搜索，很多童鞋对 google.com 和 google.cn 感觉一样，实际上是有区别的。用一句很低俗很低俗的话来说就是，google.cn 是被阉割过的 Google（虽然仍然比 baidu 好很多）。举个最简单的例子，google.cn 是没有账户信息的，也就是说，你不能通过 google.cn 来登录 Google 的服务。而且似乎在中国，在浏览器中使用 Google 会默认指向 Google 中国。再换句话说，我们一般会把 Google 认为是一个很普通的搜索引擎，但实际上如果登录 Google，会发现别有洞天。
下面我列举一些每天相伴我的，便利的 Google 服务：
资讯类：

Gmail：Google 的 一款优秀的 mail。还记得最早 Google 开放邮件系统，没有独立注册的地方，必须通过其他人邀请。
Google Reader：每天开电脑后，要做的第二件事（第一件事是 foxmail 收取 gmail）。信息需要捕捉，使用书签记录互联网信息那是 web1.0 时代，现在我们有 RSS，Google Reader <a href='http://www.bjt.name/2010/01/google-say-goodbye/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>以前就想写一篇博客，讲述 Google 给我们生活带来的便利，这不，再不写，也许再也没有机会了。</p>
<p>为什么说没机会了，是因为 Google 官方博客的一篇文章——A new approach to China（抱歉，因为是订阅的内容，已经被墙了，我实在不能找到链接，不过可以访问<a href="http://blog.sina.com.cn/s/blog_46f180bc0100h4mx.html" target="_blank">这里</a>，中文翻译的和原文），也许真的有一天 Google 会<a href="http://pyzxs.blog.sohu.com/142160649.html" target="_blank">撇下我们</a>。</p>
<p>说到 Google，感慨颇深。以前在人大读书的时候，受舍友影响，从来不知道有其他的搜索引擎，不论干啥，第一反应就是 Google 之。后来，Google 进入中国，正式提出”谷歌“的中文名称，当时我还笑话 Google 的中文名太傻。而现在呢，患有严重的 Google 依赖综合征，算是交代了。</p>
<p>www.google.com 最适宜对英文资料的搜索，很多童鞋对 google.com 和 google.cn 感觉一样，实际上是有区别的。用一句很低俗很低俗的话来说就是，google.cn 是被阉割过的 Google（虽然仍然比 baidu 好很多）。举个最简单的例子，google.cn 是没有账户信息的，也就是说，你不能通过 google.cn 来登录 Google 的服务。而且似乎在中国，在浏览器中使用 Google 会默认指向 Google 中国。再换句话说，我们一般会把 Google 认为是一个很普通的搜索引擎，但实际上如果登录 Google，会发现别有洞天。</p>
<p>下面我列举一些每天相伴我的，便利的 Google 服务：</p>
<h1>资讯类：</h1>
<ul>
<li>Gmail：Google 的 一款优秀的 mail。还记得最早 Google 开放邮件系统，没有独立注册的地方，必须通过其他人邀请。</li>
<li>Google Reader：每天开电脑后，要做的第二件事（第一件事是 foxmail 收取 gmail）。信息需要捕捉，使用书签记录互联网信息那是 web1.0 时代，现在我们有 RSS，Google Reader 可以带领我们翻墙去学统计，sigh！不过有个问题就是，如果你恰好在某个站点看到了一个很好的文章，而上面又有一个pdf链接……点击，浏览器报告错误链接……噢，那是在墙外。哪位童鞋有好办法解决，请告之。</li>
<li>Google Group：顾名思义，是小组讨论的论坛，很多志同道合的童鞋发言交流思想的地方。比如，申请了 <a href="http://groups.google.com/group/pongba?hl=zh-CN"><span>TopLanguage</span></a>，<a href="http://groups.google.com/group/cos-r-team?hl=zh-CN"><span>COS R Team</span></a> 等，不过我更倾向把它归为 maillist 的一种，就和 R 的<a href="http://www.r-project.org/mail.html" target="banner">Mailing Lists</a> 一样。</li>
<li>Google Alert：Google 中国翻译成“快讯”，恰到好处。它能告诉你每天最新发生的事情，当然发生的事情是你用关键词来定义的。</li>
</ul>
<h1>办公类：</h1>
<ul>
<li>Google Notebook：真正意义的互联网笔记本。</li>
<li>Google Docs：美国华盛顿特区政府官方使用的办公软件。挺好的，国内不知为啥又被封掉。</li>
<li>Google Talk：非常适合办公环境的即时聊天软件，聊天记录保存在 Gmail 帐号里，支持语音功能，同时有 gmail 邮件通知。</li>
<li>Google code：直接参考 R 的 sqldf 包 http://code.google.com/p/sqldf/</li>
</ul>
<h1>网站类：</h1>
<ul>
<li>Google Analytics：做网站的朋友肯定对它非常熟悉。</li>
<li>Google calendar：日程，合理规划时间是成功的必要条件。</li>
<li>Google Site 和 Google pages：功能上感觉比较类似，都是用来做站点的，但都不能用了，sigh again!</li>
<li><a href="http://picasaweb.google.com/">Goolge Picasa：</a>图片分享，也不能用了</li>
<li>Google blog：其实挺好的 blog，由于众所周知的原因，被封了（偶尔也会能上）。唯一可惜的是，上面有很多不错的统计资源。</li>
</ul>
<h1>软件类：</h1>
<ul>
<li>Google 输入法：拼音输入法，表现中规中矩，可以同步用户词典。</li>
<li>Goolge 浏览器：感觉和 firefox 差不多，当然远远比 Internet explore 好很多很多辈（强调一下——不是倍）。</li>
<li>Google 词霸：自从有个这个，我就不再买正版的金山词霸。配合 <a href="http://www.neospeech.com/" target="_blank">neospeech</a> 的 TTS （<em>text-to-speech</em>），挺舒服 ^_^</li>
<li>Google Earth：这个就更不用说了吧，我能通过它找到我家屋顶。</li>
</ul>
<p>我这里只是简单了列了一下常用的 Google 服务，像一些比如 Google 学术搜索、Google 生活搜索、地图、桌面之类的我都没有提到，但它们都在或多或少的影响着我们的生活。</p>
<p>还是那句话——我患有严重的 Google 依赖综合征。<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2006/06/tts-neo-speech/' title='让我惊讶的TTS语音库－NeoSpeech'>让我惊讶的TTS语音库－NeoSpeech</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/01/google-say-goodbye/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>
