<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>刘思喆 @ 贝吉塔行星 &#187; R 语言</title>
	<atom:link href="http://www.bjt.name/category/r/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.bjt.name</link>
	<description>R 语言，数据挖掘，数据可视化</description>
	<lastBuildDate>Wed, 18 Aug 2010 16:02:52 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>第三届中国R语言会议培训材料</title>
		<link>http://www.bjt.name/2010/06/3rd-chinese-r-trainning/</link>
		<comments>http://www.bjt.name/2010/06/3rd-chinese-r-trainning/#comments</comments>
		<pubDate>Sun, 27 Jun 2010 12:18:15 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[杂七杂八]]></category>
		<category><![CDATA[COS]]></category>
		<category><![CDATA[R 语言]]></category>
		<category><![CDATA[training]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10668</guid>
		<description><![CDATA[自第三届中国R语言会议至今，已经有些时日了。说想把培训材料再好好整理一下，无奈项目比较紧张，只好简单修改了下。回顾材料——发现写的少，讲的多…… 闲话少说，下面是材料的链接：slides 版本和 print 版本。 相关文章： 中国 R 语言会议（上海）趣闻 Oracle数据库开始支持R语言 闲聊R 第二届中国 R 语言会议（北京）随笔 学术圈子真的很小]]></description>
			<content:encoded><![CDATA[<p>自第三届中国R语言会议至今，已经有些时日了。说想把培训材料再好好整理一下，无奈项目比较紧张，只好简单修改了下。回顾材料——发现写的少，讲的多……<br />
闲话少说，下面是材料的链接：<a href="http://www.bjt.name/wp-content/uploads/2010/06/presentation.pdf">slides</a> 版本和<a href="http://www.bjt.name/wp-content/uploads/2010/06/print_version.pdf"> print</a> 版本。</p>
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2009/12/r-conference-shanghai/' title='中国 R 语言会议（上海）趣闻'>中国 R 语言会议（上海）趣闻</a></li>
<li><a href='http://www.bjt.name/2010/06/oracle-data-mining-r/' title='Oracle数据库开始支持R语言'>Oracle数据库开始支持R语言</a></li>
<li><a href='http://www.bjt.name/2010/03/something-about-r/' title='闲聊R'>闲聊R</a></li>
<li><a href='http://www.bjt.name/2009/12/r-conference-beijing/' title='第二届中国 R 语言会议（北京）随笔'>第二届中国 R 语言会议（北京）随笔</a></li>
<li><a href='http://www.bjt.name/2009/12/academic-surprise/' title='学术圈子真的很小'>学术圈子真的很小</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/06/3rd-chinese-r-trainning/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Oracle数据库开始支持R语言</title>
		<link>http://www.bjt.name/2010/06/oracle-data-mining-r/</link>
		<comments>http://www.bjt.name/2010/06/oracle-data-mining-r/#comments</comments>
		<pubDate>Tue, 08 Jun 2010 15:41:51 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[数据挖掘]]></category>
		<category><![CDATA[datamining]]></category>
		<category><![CDATA[Oracle]]></category>
		<category><![CDATA[R 语言]]></category>
		<category><![CDATA[甲骨文]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10654</guid>
		<description><![CDATA[一则令人兴奋的简讯： 据Oracle官方博客 最近更新的 New R Interface to Oracle Data Mining Available for Download，甲骨文开始正式支持R语言在Oracle数据库中的应用（简单的非官方说法是：甲骨文贡献了一个提供Oracle和R之间接口的附加包）。 援引博客中对R-ODM(R-Oracle Data Mining)的介绍： R-ODM is especially useful for: Quick prototyping of vertical or domain-based applications where the Oracle Database supports the application Scripting of &#8220;production&#8221; data mining methodologies Customizing graphics of ODM data mining results (examples: classification, regression, anomaly detection) 众所周知，R在实现原型算法方面有着不可替代的巨大优势。诚然，通过R实现的一般性数据挖掘算法都可以嵌入到数据库中，但Oracle提供的这个接口，极大地提高了挖掘算法的部署效率。 今天（2010.06.08），CRAN上更新了RODM包的1.0-2版本，支持Windows、Linux、MacOS X系统。 下面是RODM包帮助文档中的一个例子，可以初步地体会算法高效的部署： ### <a href='http://www.bjt.name/2010/06/oracle-data-mining-r/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>一则令人兴奋的简讯：</p>
<p>据<a href="http://blogs.oracle.com/" target="_blank">Oracle官方博客</a> 最近更新的 <a href="http://blogs.oracle.com/datamining/2010/05/new_r_interface_to_oracle_data_mining_available_for_download.html" target="_self">New R Interface to Oracle Data Mining Available for Download</a>，甲骨文开始正式支持R语言在Oracle数据库中的应用（简单的非官方说法是：甲骨文贡献了一个提供Oracle和R之间接口的附加包）。</p>
<p>援引博客中对R-ODM(R-Oracle Data Mining)的介绍：</p>
<p>R-ODM is especially useful for:</p>
<ul>
<li>Quick prototyping of vertical or domain-based applications where the Oracle Database supports the application</li>
<li>Scripting of &#8220;production&#8221; data mining methodologies</li>
<li>Customizing graphics of ODM data mining results (examples: <a href="http://www.oracle.com/technology/products/bi/odm/images/rodm_classification.jpg">classification</a>, <a href="http://www.oracle.com/technology/products/bi/odm/images/rodm_regression.jpg">regression</a>, <a href="http://www.oracle.com/technology/products/bi/odm/images/rodm_anomaly_detection.jpg">anomaly detection</a>)</li>
</ul>
<p>众所周知，R在实现原型算法方面有着不可替代的巨大优势。诚然，通过R实现的一般性数据挖掘算法都可以嵌入到数据库中，但Oracle提供的这个接口，极大地提高了挖掘算法的部署效率。</p>
<p>今天（2010.06.08），<a href="http://cran.r-project.org/" target="_self">CRAN</a>上更新了<a href="http://cran.r-project.org/web/packages/RODM/index.html" target="_self">RODM</a>包的1.0-2版本，支持Windows、Linux、MacOS X系统。</p>
<p>下面是RODM包帮助文档中的一个例子，可以初步地体会算法高效的部署：</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;"><span style="color: #228B22;">### GLM Regression</span>
<span style="color: #228B22;">## Not run:</span>
x1 <span style="color: #080;">&lt;-</span> <span style="color: #ff0000;">2</span> <span style="color: #080;">*</span> <span style="color: #0000FF; font-weight: bold;">runif</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">200</span><span style="color: #080;">&#41;</span>
noise <span style="color: #080;">&lt;-</span> <span style="color: #ff0000;">3</span> <span style="color: #080;">*</span> <span style="color: #0000FF; font-weight: bold;">runif</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">200</span><span style="color: #080;">&#41;</span> <span style="color: #080;">-</span> <span style="color: #ff0000;">1.5</span>
y1 <span style="color: #080;">&lt;-</span> <span style="color: #ff0000;">2</span> <span style="color: #080;">+</span> <span style="color: #ff0000;">2</span><span style="color: #080;">*</span>x1 <span style="color: #080;">+</span> x1<span style="color: #080;">*</span>x1 <span style="color: #080;">+</span> noise
dataset <span style="color: #080;">&lt;-</span> <span style="color: #0000FF; font-weight: bold;">data.<span style="">frame</span></span><span style="color: #080;">&#40;</span>x1, y1<span style="color: #080;">&#41;</span>
<span style="color: #0000FF; font-weight: bold;">names</span><span style="color: #080;">&#40;</span>dataset<span style="color: #080;">&#41;</span> <span style="color: #080;">&lt;-</span> <span style="color: #0000FF; font-weight: bold;">c</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;X1&quot;</span>, <span style="color: #ff0000;">&quot;Y1&quot;</span><span style="color: #080;">&#41;</span>
RODM_create_dbms_table<span style="color: #080;">&#40;</span>DB, <span style="color: #ff0000;">&quot;dataset&quot;</span><span style="color: #080;">&#41;</span>   <span style="color: #228B22;"># Push the training table to the database</span>
&nbsp;
<span style="color: #0000FF; font-weight: bold;">glm</span> <span style="color: #080;">&lt;-</span> RODM_create_glm_model<span style="color: #080;">&#40;</span>database <span style="color: #080;">=</span> DB,    <span style="color: #228B22;"># Create ODM GLM model</span>
                             data_table_name <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;dataset&quot;</span>,
                             target_column_name <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;Y1&quot;</span>,
                             mining_function <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;regression&quot;</span><span style="color: #080;">&#41;</span>
&nbsp;
glm2 <span style="color: #080;">&lt;-</span> RODM_apply_model<span style="color: #080;">&#40;</span>database <span style="color: #080;">=</span> DB,    <span style="color: #228B22;"># Predict training data</span>
                             data_table_name <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;dataset&quot;</span>,
                             model_name <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;GLM_MODEL&quot;</span>,
                             supplemental_cols <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;X1&quot;</span><span style="color: #080;">&#41;</span>
windows<span style="color: #080;">&#40;</span>height<span style="color: #080;">=</span><span style="color: #ff0000;">8</span>, width<span style="color: #080;">=</span><span style="color: #ff0000;">12</span><span style="color: #080;">&#41;</span>
<span style="color: #0000FF; font-weight: bold;">plot</span><span style="color: #080;">&#40;</span>x1, y1, pch<span style="color: #080;">=</span><span style="color: #ff0000;">20</span>, <span style="color: #0000FF; font-weight: bold;">col</span><span style="color: #080;">=</span><span style="color: #ff0000;">&quot;blue&quot;</span><span style="color: #080;">&#41;</span>
<span style="color: #0000FF; font-weight: bold;">points</span><span style="color: #080;">&#40;</span>x<span style="color: #080;">=</span>glm2$model.<span style="">apply</span>.<span style="">results</span><span style="color: #080;">&#91;</span>, <span style="color: #ff0000;">&quot;X1&quot;</span><span style="color: #080;">&#93;</span>,
       glm2$model.<span style="">apply</span>.<span style="">results</span><span style="color: #080;">&#91;</span>, <span style="color: #ff0000;">&quot;PREDICTION&quot;</span><span style="color: #080;">&#93;</span>, pch<span style="color: #080;">=</span><span style="color: #ff0000;">20</span>, <span style="color: #0000FF; font-weight: bold;">col</span><span style="color: #080;">=</span><span style="color: #ff0000;">&quot;red&quot;</span><span style="color: #080;">&#41;</span>
<span style="color: #0000FF; font-weight: bold;">legend</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">0.5</span>, <span style="color: #ff0000;">9</span>, <span style="color: #0000FF; font-weight: bold;">legend</span> <span style="color: #080;">=</span> <span style="color: #0000FF; font-weight: bold;">c</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;actual&quot;</span>, <span style="color: #ff0000;">&quot;GLM regression&quot;</span><span style="color: #080;">&#41;</span>, pch <span style="color: #080;">=</span> <span style="color: #0000FF; font-weight: bold;">c</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">20</span>, <span style="color: #ff0000;">20</span><span style="color: #080;">&#41;</span>,
                <span style="color: #0000FF; font-weight: bold;">col</span> <span style="color: #080;">=</span> <span style="color: #0000FF; font-weight: bold;">c</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;blue&quot;</span>, <span style="color: #ff0000;">&quot;red&quot;</span><span style="color: #080;">&#41;</span>,
                pt.<span style="">bg</span> <span style="color: #080;">=</span>  <span style="color: #0000FF; font-weight: bold;">c</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;blue&quot;</span>, <span style="color: #ff0000;">&quot;red&quot;</span><span style="color: #080;">&#41;</span>, cex <span style="color: #080;">=</span> <span style="color: #ff0000;">1.20</span>, pt.<span style="">cex</span><span style="color: #080;">=</span><span style="color: #ff0000;">1.5</span>, bty<span style="color: #080;">=</span><span style="color: #ff0000;">&quot;n&quot;</span><span style="color: #080;">&#41;</span>
&nbsp;
RODM_drop_model<span style="color: #080;">&#40;</span>DB, <span style="color: #ff0000;">&quot;GLM_MODEL&quot;</span><span style="color: #080;">&#41;</span>            <span style="color: #228B22;"># Drop the model</span>
RODM_drop_dbms_table<span style="color: #080;">&#40;</span>DB, <span style="color: #ff0000;">&quot;dataset&quot;</span><span style="color: #080;">&#41;</span>   <span style="color: #228B22;"># Drop the database table</span>
RODM_close_dbms_connection<span style="color: #080;">&#40;</span>DB<span style="color: #080;">&#41;</span>
RODM_close_dbms_connection<span style="color: #080;">&#40;</span>DB<span style="color: #080;">&#41;</span></pre></div></div>

<blockquote><p>说一句题外话：<br />
R的影响力除了在统计分析领域（SAS、SPSS、Statistica已经都开始支持R接口）外，已然发展到了商业数据库领域。</p></blockquote>
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2009/05/kdnuggets-datamining-survey/' title='KDnuggets 关于数据挖掘软件的调查'>KDnuggets 关于数据挖掘软件的调查</a></li>
<li><a href='http://www.bjt.name/2009/07/welfare-lottery-justice/' title='从一等奖出现的概率看中国福利彩票的公正性'>从一等奖出现的概率看中国福利彩票的公正性</a></li>
<li><a href='http://www.bjt.name/2009/04/hoopchina-single-index-yaoming/' title='关于在hoopchina上发帖的回答'>关于在hoopchina上发帖的回答</a></li>
<li><a href='http://www.bjt.name/2009/12/r-conference-shanghai/' title='中国 R 语言会议（上海）趣闻'>中国 R 语言会议（上海）趣闻</a></li>
<li><a href='http://www.bjt.name/2009/12/r-conference-beijing/' title='第二届中国 R 语言会议（北京）随笔'>第二届中国 R 语言会议（北京）随笔</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/06/oracle-data-mining-r/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>闲聊R</title>
		<link>http://www.bjt.name/2010/03/something-about-r/</link>
		<comments>http://www.bjt.name/2010/03/something-about-r/#comments</comments>
		<pubDate>Wed, 31 Mar 2010 12:11:59 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[R 语言]]></category>
		<category><![CDATA[mindmap]]></category>
		<category><![CDATA[SAS]]></category>
		<category><![CDATA[SPSS]]></category>
		<category><![CDATA[training]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10640</guid>
		<description><![CDATA[上周在部门内部做了一个小规模的R相关培训，大致把R的整体构架和特点做了个综述。聊得非常随意，天马行空。在这里，贴出概要（下图）和大家一起分享： （顺序是：从右至左，由上至下） 红色是重点讲的部分，当然还穿插了一些关于R的八卦：比如R和SPSS、SAS之间的故事……。我发现大家对“八卦”还是相当感兴趣的：） 相关文章： KDnuggets 关于数据挖掘软件的调查 SPSS 创立者 Norman Nie 加入 R 社区 IBM 花费 12 亿美元收购 SPSS SPSS 重塑金身]]></description>
			<content:encoded><![CDATA[<p>上周在部门内部做了一个小规模的R相关培训，大致把R的整体构架和特点做了个综述。聊得非常随意，天马行空。在这里，贴出概要（下图）和大家一起分享：</p>
<p>（顺序是：从右至左，由上至下）</p>
<p style="text-align: center;"><a href="http://www.bjt.name/wp-content/uploads/2010/03/R-简介.png"><img class="size-full wp-image-10641 aligncenter" title="R 简介" src="http://www.bjt.name/wp-content/uploads/2010/03/R-简介.png" alt="" width="879" height="631" /></a></p>
<p>红色是重点讲的部分，当然还穿插了一些关于R的八卦：比如R和SPSS、SAS之间的故事……。我发现大家对“八卦”还是相当感兴趣的：）<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2009/05/kdnuggets-datamining-survey/' title='KDnuggets 关于数据挖掘软件的调查'>KDnuggets 关于数据挖掘软件的调查</a></li>
<li><a href='http://www.bjt.name/2009/10/spss-norman-nie-r/' title='SPSS 创立者 Norman Nie 加入 R 社区'>SPSS 创立者 Norman Nie 加入 R 社区</a></li>
<li><a href='http://www.bjt.name/2009/07/ibm-spss-acquisition/' title='IBM 花费 12 亿美元收购 SPSS'>IBM 花费 12 亿美元收购 SPSS</a></li>
<li><a href='http://www.bjt.name/2009/04/spss-pasw/' title='SPSS 重塑金身'>SPSS 重塑金身</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/03/something-about-r/feed/</wfw:commentRss>
		<slash:comments>9</slash:comments>
		</item>
		<item>
		<title>中国及周边版图地震情况可视化</title>
		<link>http://www.bjt.name/2010/01/chinese-earthquake-visualization/</link>
		<comments>http://www.bjt.name/2010/01/chinese-earthquake-visualization/#comments</comments>
		<pubDate>Tue, 26 Jan 2010 15:42:09 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[图型展示]]></category>
		<category><![CDATA[earth quake]]></category>
		<category><![CDATA[唐山]]></category>
		<category><![CDATA[地震]]></category>
		<category><![CDATA[运城]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10561</guid>
		<description><![CDATA[大自然的力量永远让人敬畏，地震、海啸、陨石、雷击……因为我们在大自然的面前如此渺小，所以我们必须协作，必须发展科技，必须懂统计 ：） 说到地震，我可能比较敏感，因为我是唐山人。虽然 76 年唐山大地震时，我还没有形成碳水化合物形态，但后来，每每听到老一辈讲起当时的惨烈，心常戚戚。 讲几则作为唐山人的小故事： 小时候对地震的初相识：有一次刚刚从床上爬起来，正在懒洋洋的坐着穿衣服，就发觉床开始做规则的前后晃动。当时年龄小，很无知，只知道傻乎乎地沉浸在如秋千般的跳动中，那叫个带劲…… 有一次上课，感觉课桌在晃动，没法看书，于是停下来查看周围哪个同学在晃。检查一圈发现周围几个同学没有一个再晃！结果，紧张地直接拍案而起，大呼——地震啦（事后新闻证明是真的）！在我们那儿，这点比较好：即使是课上误判地震的这种事儿，一般老师都是笑笑而过 ；） 每年我们那都会有地震的谣言，而且说的神乎其神，俺老爸一般会守夜（感谢俺老爸！）。或者天气好的话，干脆去广场之类空旷的地方，找地方打地铺。当然一般都是打牌、聊天到 24 点，然后回家睡觉。 恩，不多扯了，言归正传。自从汶川大地震以后，国人对地震明显敏感很多。且不说海地，单单前两天（24日）山西河津、运城地震就让然琢磨不懂：有人说，21日山西省地震局辟谣称不会有地震，但运城震感明显。为什么地震局会出来辟谣，仔细一读，原来才知——地震局指的是“破坏性”地震。 但有个问题： 国务院1995年颁布的《破坏性地震应急条例》，破坏性地震指“造成一定数量的人员伤亡和经济损失的地震事件”， 并没有规定特定的级数。 这破坏级地震可不是闹着玩的，得仔细瞧瞧最近这地震都发生在哪里了，震级多大？是不是会对我们构成威胁！？于是有了下面这张图——最近一周中国及周边版图地震情况（1月20日至1月25日共计六天）： 数据童鞋们可以在这里查看，里面的震级需要注意一下，有Ms和ML两种，换算关系如下。但具体什么意思大家直接 wiki 好了。 ml=(1.17mb+0．67)/1.13 ml=(ms+1.08)/1.13 一些说明（不是写商业报告，偷工减料啦）： 蓝色的背景是地震点的密度——也许是喜马拉雅造山运动，也许是三峡工程，不管怎样，四川地区不太平啊！弟兄们小心！ 红色的点代表地震的位置，其大小表示震级的大小。 从1月20日至1月25日，版图周边共计有901条地震记录（有点吓人）！其中大于ML5级的一共两次： 2010-01-24  10:36:13.8       35.45   110.70       15 Ms4.8  天然地震        山西河津 2010-01-21  10:02:02.8       13.70   125.85       33 Ms5.1  天然地震  菲律宾群岛地区 最后我们再回头看一下，最近一周地震的震级（ML）分布： 至少可以长舒一口气，原来大部分都是小震，不具“破坏性”的居多。 相关文章： 没有了，随便看看吧 ^_^]]></description>
			<content:encoded><![CDATA[<p>大自然的力量永远让人敬畏，<a href="http://en.wikipedia.org/wiki/Earth_quake" target="_blank">地震</a>、海啸、<a href="http://www.bjt.name/2009/06/france-flight-poisson/" target="_blank">陨石</a>、雷击……因为我们在大自然的面前如此渺小，所以我们必须协作，必须发展科技，必须懂统计 ：）</p>
<p>说到地震，我可能比较敏感，因为我是唐山人。虽然 76 年唐山大地震时，我还没有形成碳水化合物形态，但后来，每每听到老一辈讲起当时的惨烈，心常戚戚。</p>
<p>讲几则作为唐山人的小故事：</p>
<ol>
<li>小时候对地震的初相识：有一次刚刚从床上爬起来，正在懒洋洋的坐着穿衣服，就发觉床开始做规则的前后晃动。当时年龄小，很无知，只知道傻乎乎地沉浸在如秋千般的跳动中，那叫个带劲……</li>
<li>有一次上课，感觉课桌在晃动，没法看书，于是停下来查看周围哪个同学在晃。检查一圈发现周围几个同学没有一个再晃！结果，紧张地直接拍案而起，大呼——地震啦（事后新闻证明是真的）！在我们那儿，这点比较好：即使是课上误判地震的这种事儿，一般老师都是笑笑而过 ；）</li>
<li>每年我们那都会有地震的谣言，而且说的神乎其神，俺老爸一般会守夜（感谢俺老爸！）。或者天气好的话，干脆去广场之类空旷的地方，找地方打地铺。当然一般都是打牌、聊天到 24 点，然后回家睡觉。</li>
</ol>
<p>恩，不多扯了，言归正传。自从汶川大地震以后，国人对地震明显敏感很多。且不说海地，单单前两天（24日）山西河津、运城地震就让然琢磨不懂：有人说，<a href="http://blog.sina.com.cn/s/blog_5e9f35ea0100gl1w.html" target="_blank">21日山西省地震局辟谣称不会有地震</a>，但运城震感明显。为什么地震局会出来辟谣，仔细一读，原来才知——地震局指的是“破坏性”地震。</p>
<p>但有个问题：</p>
<pre>国务院1995年颁布的《破坏性地震应急条例》，破坏性地震指“造成一定数量的人员伤亡和经济损失的地震事件”，
并没有规定特定的级数。</pre>
<p>这破坏级地震可不是闹着玩的，得仔细瞧瞧最近这地震都发生在哪里了，震级多大？是不是会对我们构成威胁！？于是有了下面这张图——最近一周中国及周边版图地震情况（1月20日至1月25日共计六天）：</p>
<p><a href="http://www.bjt.name/wp-content/uploads/2010/01/earthquake.png"><img class="aligncenter size-full wp-image-10562" title="earthquake" src="http://www.bjt.name/wp-content/uploads/2010/01/earthquake.png" alt="" width="730" height="653" /></a></p>
<p>数据童鞋们可以在<a href="http://data.earthquake.cn/datashare/globeEarthquake_csn.jsp" target="_blank">这里</a>查看，里面的震级需要注意一下，有Ms和ML两种，换算关系如下。但具体什么意思大家直接 wiki 好了。</p>
<pre>ml=(1.17mb+0．67)/1.13
ml=(ms+1.08)/1.13</pre>
<p>一些说明（不是写商业报告，偷工减料啦）：</p>
<p>蓝色的背景是地震点的密度——也许是喜马拉雅造山运动，也许是三峡工程，不管怎样，四川地区不太平啊！弟兄们小心！</p>
<p>红色的点代表地震的位置，其大小表示震级的大小。</p>
<p>从1月20日至1月25日，版图周边共计有901条地震记录（有点吓人）！其中大于ML5级的一共两次：</p>
<p>2010-01-24  10:36:13.8       35.45   110.70       15 Ms4.8  天然地震        山西河津<br />
2010-01-21  10:02:02.8       13.70   125.85       33 Ms5.1  天然地震  菲律宾群岛地区</p>
<p>最后我们再回头看一下，最近一周地震的震级（ML）分布：</p>
<p><a href="http://www.bjt.name/wp-content/uploads/2010/01/hist_earth.png"><img class="aligncenter size-medium wp-image-10565" title="hist_earth" src="http://www.bjt.name/wp-content/uploads/2010/01/hist_earth-300x271.png" alt="" width="300" height="271" /></a>至少可以长舒一口气，原来大部分都是小震，不具“破坏性”的居多。<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li>没有了，随便看看吧 ^_^</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/01/chinese-earthquake-visualization/feed/</wfw:commentRss>
		<slash:comments>16</slash:comments>
		</item>
		<item>
		<title>NBA联盟50位顶级球员的指标表现</title>
		<link>http://www.bjt.name/2010/01/nba-top-50-scorers-performance/</link>
		<comments>http://www.bjt.name/2010/01/nba-top-50-scorers-performance/#comments</comments>
		<pubDate>Thu, 21 Jan 2010 16:32:58 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[图型展示]]></category>
		<category><![CDATA[篮球]]></category>
		<category><![CDATA[flowingdata]]></category>
		<category><![CDATA[heatmap]]></category>
		<category><![CDATA[nba]]></category>
		<category><![CDATA[yaoming]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10539</guid>
		<description><![CDATA[有点标题党的嫌疑，实际是介绍如何使用 R 绘制 heatmap 的文章。 今天无意间在Flowingdata看到一篇关于如何使用 R 来做 heatmap 的文章（请移步到这里）。虽然 heatmap 只是 R 中一个很普通的图形函数，但这个例子使用了2008-2009赛季 NBA 50个顶级球员数据做了一个极佳的演示，效果非常不错。对 R 大致了解的童鞋可以直接在 R console 上敲 ？heatmap 直接查看帮助即可。 没有接触过 R 的童鞋继续围观，下面会仔细介绍如何使用 R 实现 NBA 50位顶级球员指标表现热图： 关于 heatmap，中文一般翻译为“热图”，其统计意义wiki上解释的很清楚： A heat map is a graphical representation of data where the values taken by a variable in a two-dimensional map are represented as <a href='http://www.bjt.name/2010/01/nba-top-50-scorers-performance/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>有点标题党的嫌疑，实际是介绍如何使用 R 绘制 heatmap 的文章。</p>
<p>今天无意间在<a href="http://flowingdata.com/about/" target="_blank">Flowingdata</a>看到一篇关于如何使用 R 来做 heatmap 的文章（请移步到<a href="http://flowingdata.com/2010/01/21/how-to-make-a-heatmap-a-quick-and-easy-solution/" target="_blank">这里</a>）。虽然 heatmap 只是 R 中一个很普通的图形函数，但这个例子使用了2008-2009赛季 NBA 50个顶级球员数据做了一个极佳的演示，效果非常不错。对 R 大致了解的童鞋可以直接在 R console 上敲</p>
<p><strong>？heatmap</strong></p>
<p>直接查看帮助即可。</p>
<p>没有接触过 R 的童鞋继续围观，下面会仔细介绍如何使用 R 实现 NBA 50位顶级球员指标表现热图：</p>
<p>关于 heatmap，中文一般翻译为“热图”，其统计意义<a href="http://en.wikipedia.org/wiki/Heatmap" target="_blank">wiki</a>上解释的很清楚：</p>
<blockquote><p>A <strong>heat map</strong> is a graphical representation of data where the values taken by a <a title="Variable (mathematics)" href="http://en.wikipedia.org/wiki/Variable_%28mathematics%29">variable</a> in a two-dimensional map are represented as colors.Heat maps originated in 2D displays of the values in a data matrix. Larger values were represented by small dark gray or black squares (pixels) and smaller values by lighter squares.</p></blockquote>
<p>下面这个图即是<a href="http://flowingdata.com/about/" target="_blank">Flowingdata</a>用一些 <a href="http://www.r-project.org" target="_blank">R</a> 函数对2008-2009 赛季NBA 50名顶级球员指标做的一个热图（点击参看<a href="http://www.bjt.name/wp-content/uploads/2010/01/heatmap1.png" target="_blank">大图</a>）：</p>
<p style="text-align: center;"><a href="http://www.bjt.name/wp-content/uploads/2010/01/heatmap1.png"></a></p>
<p style="text-align: center;"><a href="http://www.bjt.name/wp-content/uploads/2010/01/heatmap1.png"><img class="aligncenter size-medium wp-image-10542" title="heatmap1" src="http://www.bjt.name/wp-content/uploads/2010/01/heatmap1-300x289.png" alt="" width="300" height="289" /></a></p>
<p><strong>先解释一下数据：</strong></p>
<p>这里共列举了50位球员，估计爱好篮球的童鞋对上图右边的每个名字都会耳熟能详。这些球员每个人会有19个指标，包括打了几场球（G)、上场几分钟（MIN)、得分（PTS)……这样就行成了一个50行×19列的矩阵。但问题是，数据有些多，需要使用一种比较好的办法来展示，So it comes, heatmap!</p>
<p><strong>简单的说明：</strong></p>
<p>比如从上面的热图上观察得分前3名（Wade、James、Bryant）PTS、FGM、FGA比较高，但Bryant的FTM、FTA和前两者就差一些；Wade在这三人中STL是佼佼者；而James的DRB和TRB又比其他两人好一些……</p>
<p>姚明的3PP（3 Points Percentage）这条数据很有意思，非常出色！仔细查了一下这个数值，居然是100%。仔细回想一下，似乎那个赛季姚明好像投过一个3分，并且中了，然后再也没有3p。这样本可真够小的！</p>
<p><strong>最后是如何做这个热图（做了些许修改）：</strong></p>
<p><span style="color: #993366;">Step 0. Download R</span></p>
<p>R 官网：<a href="http://www.r-project.org">http://www.r-project.org</a>，它是免费的。官网上面提供了Windows,Mac,Linux版本（或源代码）的R程序。</p>
<p><span style="color: #993366;">Step 1. Load the data</span></p>
<p>R 可以支持网络路径，使用读取csv文件的函数read.csv。</p>
<p>读取数据就这么简单：</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;"><span style="color: #0000FF; font-weight: bold;">read.<span style="">csv</span></span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;http://datasets.flowingdata.com/ppg2008.csv&quot;</span>, sep<span style="color: #080;">=</span><span style="color: #ff0000;">&quot;,&quot;</span><span style="color: #080;">&#41;</span></pre></div></div>

<p><span style="color: #993366;">Step 2. Sort data</span></p>
<p>按照球员得分，将球员从小到大排序：</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;">nba <span style="color: #080;">&lt;-</span> nba<span style="color: #080;">&#91;</span><span style="color: #0000FF; font-weight: bold;">order</span><span style="color: #080;">&#40;</span>nba$PTS<span style="color: #080;">&#41;</span>,<span style="color: #080;">&#93;</span></pre></div></div>

<p><code>当然也可以选择MIN,BLK,STL之类指标</code></p>
<p><span style="color: #993366;">Step 3. Prepare data</span></p>
<p>把行号换成行名（球员名称）：</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;"><span style="color: #0000FF; font-weight: bold;">row.<span style="">names</span></span><span style="color: #080;">&#40;</span>nba<span style="color: #080;">&#41;</span> <span style="color: #080;">&lt;-</span> nba$Name</pre></div></div>

<p><code>去掉第一列行号：</code></p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;">nba <span style="color: #080;">&lt;-</span> nba<span style="color: #080;">&#91;</span>,<span style="color: #ff0000;">2</span><span style="color: #080;">:</span><span style="color: #ff0000;">20</span><span style="color: #080;">&#93;</span> <span style="color: #228B22;"># or nba &lt;- nba[,-1]</span></pre></div></div>

<p><span style="color: #993366;">Step 4. Prepare data, again</span></p>
<p>把 data frame 转化为我们需要的矩阵格式：</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;">nba_matrix <span style="color: #080;">&lt;-</span> <span style="color: #0000FF; font-weight: bold;">data.<span style="">matrix</span></span><span style="color: #080;">&#40;</span>nba<span style="color: #080;">&#41;</span></pre></div></div>

<p><span style="color: #993366;">Step 5. Make a heatmap</span></p>
<p># R 的默认还会在图的左边和上边绘制 dendrogram，使用Rowv=NA, Colv=NA去掉</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;"><span style="color: #0000FF; font-weight: bold;">heatmap</span><span style="color: #080;">&#40;</span>nba_matrix, Rowv<span style="color: #080;">=</span>NA, Colv<span style="color: #080;">=</span>NA, <span style="color: #0000FF; font-weight: bold;">col</span><span style="color: #080;">=</span><span style="color: #0000FF; font-weight: bold;">cm.<span style="">colors</span></span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">256</span><span style="color: #080;">&#41;</span>, revC<span style="color: #080;">=</span>FALSE, <span style="color: #0000FF; font-weight: bold;">scale</span><span style="color: #080;">=</span><span style="color: #ff0000;">'column'</span><span style="color: #080;">&#41;</span></pre></div></div>

<p><code>这样就得到了上面的那张热图。</code></p>
<p><span style="color: #993366;">Step 6. Color selection</span></p>
<p>或者想把热图中的颜色换一下：</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;"><span style="color: #0000FF; font-weight: bold;">heatmap</span><span style="color: #080;">&#40;</span>nba_matrix, Rowv<span style="color: #080;">=</span>NA, Colv<span style="color: #080;">=</span>NA, <span style="color: #0000FF; font-weight: bold;">col</span><span style="color: #080;">=</span><span style="color: #0000FF; font-weight: bold;">heat.<span style="">colors</span></span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">256</span><span style="color: #080;">&#41;</span>, revC<span style="color: #080;">=</span>FALSE, <span style="color: #0000FF; font-weight: bold;">scale</span><span style="color: #080;">=</span><span style="color: #ff0000;">&quot;column&quot;</span>, margins<span style="color: #080;">=</span><span style="color: #0000FF; font-weight: bold;">c</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">5</span>,<span style="color: #ff0000;">10</span><span style="color: #080;">&#41;</span><span style="color: #080;">&#41;</span></pre></div></div>

<p><code><strong>延伸阅读：</strong></code></p>
<p><code>来自于kerimcan和<a href="http://periscopic.com/">krees</a>这些人的讨论：</code></p>
<p><code><strong><a rel="nofollow" href="http://sekhon.polisci.berkeley.edu/stats/html/heatmap.html">http://sekhon.polisci.berkeley.edu/stats/html/heatmap.html</a><br />
<a rel="nofollow" href="http://enotacoes.wordpress.com/2007/11/16/easy-guide-to-drawing-heat-maps-to-pdf-with-r-with-color-key/">http://enotacoes.wordpress.com/2007/11/16/easy-guide-to-drawing-heat-maps-to-pdf-with-r-with-color-key/</a></strong></code></p>
<p><strong>补充：</strong></p>
<p>早上起来发现 David Smith 同样更新了<a href="http://blog.revolution-computing.com/2010/01/how-to-make-a-heat-map-in-r.html" target="_blank">博客</a>。唉，这厮嗅觉也忒灵敏！哈哈<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2009/03/%e4%bb%8e%e6%95%b0%e6%8d%ae%e7%9c%8b2008-2009%e8%b5%9b%e5%ad%a3%e7%9a%84%e7%81%ab%e7%ae%ad%e9%98%9f/' title='从数据看2008-2009赛季的火箭队'>从数据看2008-2009赛季的火箭队</a></li>
<li><a href='http://www.bjt.name/2010/01/rockets-heat-assists-network/' title='火箭对热火比赛（20100116）中，火箭球员的助攻网络关系'>火箭对热火比赛（20100116）中，火箭球员的助攻网络关系</a></li>
<li><a href='http://www.bjt.name/2009/04/hou-vs-lal-fieldgoal%ef%bc%89/' title='投篮点和命中率（2009-04-04 HOU vs. LAL）'>投篮点和命中率（2009-04-04 HOU vs. LAL）</a></li>
<li><a href='http://www.bjt.name/2009/02/article-zhang/' title='信陵*张公子'>信陵*张公子</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/01/nba-top-50-scorers-performance/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>火箭对热火比赛（20100116）中，火箭球员的助攻网络关系</title>
		<link>http://www.bjt.name/2010/01/rockets-heat-assists-network/</link>
		<comments>http://www.bjt.name/2010/01/rockets-heat-assists-network/#comments</comments>
		<pubDate>Sat, 16 Jan 2010 15:01:09 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[数据挖掘]]></category>
		<category><![CDATA[篮球]]></category>
		<category><![CDATA[networks]]></category>
		<category><![CDATA[rockets]]></category>
		<category><![CDATA[sna]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10517</guid>
		<description><![CDATA[本场比赛前7分钟火箭发挥还不错，最高取得了10分的领先（11-21），但受上一场力拼森林狼三个加时影响，火箭诸将体能逐渐不支，慢慢失去优势。虽然巴丁格整场替补发挥出色，无奈，随着阿里扎上篮不进，比分定格在了115-106。 相比热火发烫的53.6%投篮命中率，火箭发挥比较正常，48.7%。火箭唯一问题出现在了失误方面，8-15，如果火箭失误控制的好，也许结果可能是另外一个结果。 比赛过程中，杨毅提到（大致意思）：由于没有超级球星，火箭必须比其他球队付出更多的努力才能获得胜利，也就是说其他球队会从容地为季后赛调整状态。火箭没有这个资本，为了常规赛的成绩，火箭进入疲劳期的时间要更早。要保证后面的球队成绩，要么莫雷尽最大能力交易，补充火箭；要么阿德尔曼通过更加合理细致的轮转，让每个核心球员得到充分休息。 问题来了：在不改变现有火箭球员结构的前提下，火箭的战术轮转体系中，球员的位置如何？ 引子： 本场比赛火箭一共20个助攻，Brooks 和 Battier 分别助攻了最高的5个和4个。每次助攻都会涉及两位球员，那么本场比赛所有助攻结果综合在一起，即我们将助攻者和被助攻者之间的关系使用社会网络关系表现出来，会有一些有趣的现象： 注释： 箭头方向是助攻方向，比如最下面的是 Shane Battier 给 Chuck Hayes 的助攻。 整理几个重要的关键点来评论一下： Brooks 无疑是比赛的发起者，我们发现他的助攻几乎包括了中锋、前锋位置的所有人（但不包括阿里扎，好像我记得有个镜头阿里扎要球，Brooks 没有理会）。 Battier 既是助攻的受益者，又是助攻的发起者。个人一直比较喜欢的球员，篮球智商非常高。 Budinger 这场比赛发挥出色，同队友给予其的帮助分不开。我们看到很多个球员对其都有直接帮助。 Andersen 从助攻网络关系角度看，属于一个策应型中锋，而且是由里向外策应的那类。从比赛中观察，似乎球风有些偏软（本赛季我第一次看直播比赛 ^_^） Ariza 接受的助攻并不多，只有 Battier 的一次，其他都是给别人的助攻，和 Brooks 一样，属于个人能力比较强，擅于自己创造得分机会的球员。 假如： 我是教练组成员，我提议（单从本场比赛结果看）： Brooks、Battier、Ariza、Andersen 在火箭进攻体系中位置比较重要，轮转的时候尽量保证其中的两人或三人同时在场。 Budinger 属于绝好的替补球员，但似乎不适合同 Battier、Hayes 同时在场。 Lowry 在组织进攻方面能力欠佳，使用上须谨慎。 更新分割: 40场比赛助攻数据同时考虑，结果有些凌乱： 注：这个赛季火箭队有一些球员实际上并没有真正的进入轮转，比如&#8221;Tracy McGrady&#8221;,&#8221;Mike Harris&#8221;,&#8221;Jermaine Taylor&#8221;,&#8221;Pops Mensah-Bonsu&#8221;,&#8221;Brian Cook&#8221;。虽然有些球员（比如麦蒂）的确对球队的（被）助攻仍有帮助，但贡献非常有限。出于结果整洁性的考虑，上图已将这些球员因素剔除。 由于绘图算法使用的是 Force-based_algorithms，也就是说这种算法做出的图，边（edges）会尽可能的少。解释为，对球员关系的影响就是： 同其他球员关系比较多的球员将绘制的比较靠近中心，而关系较少的球员会绘制在相对靠外的位置。 <a href='http://www.bjt.name/2010/01/rockets-heat-assists-network/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>本场比赛前7分钟火箭发挥还不错，最高取得了10分的领先（11-21），但受上一场力拼森林狼三个加时影响，火箭诸将体能逐渐不支，慢慢失去优势。虽然巴丁格整场替补发挥出色，无奈，随着阿里扎上篮不进，比分定格在了115-106。</p>
<p>相比热火发烫的53.6%投篮命中率，火箭发挥比较正常，48.7%。火箭唯一问题出现在了失误方面，8-15，如果火箭失误控制的好，也许结果可能是另外一个结果。</p>
<p>比赛过程中，杨毅提到（大致意思）：由于没有超级球星，火箭必须比其他球队付出更多的努力才能获得胜利，也就是说其他球队会从容地为季后赛调整状态。火箭没有这个资本，为了常规赛的成绩，火箭进入疲劳期的时间要更早。要保证后面的球队成绩，要么莫雷尽最大能力交易，补充火箭；要么阿德尔曼通过更加合理细致的轮转，让每个核心球员得到充分休息。</p>
<p>问题来了：在不改变现有火箭球员结构的前提下，火箭的战术轮转体系中，球员的位置如何？</p>
<p>引子：</p>
<p>本场比赛火箭一共20个助攻，Brooks 和 Battier 分别助攻了最高的5个和4个。每次助攻都会涉及两位球员，那么本场比赛所有助攻结果综合在一起，即我们将助攻者和被助攻者之间的关系使用社会网络关系表现出来，会有一些有趣的现象：</p>
<p><a href="http://www.bjt.name/wp-content/uploads/2010/01/hou.png"><img class="aligncenter size-full wp-image-10516" title="hou" src="http://www.bjt.name/wp-content/uploads/2010/01/hou.png" alt="" width="485" height="449" /></a></p>
<p>注释：</p>
<p>箭头方向是助攻方向，比如最下面的是 Shane Battier 给 Chuck Hayes 的助攻。</p>
<p>整理几个重要的关键点来评论一下：</p>
<ol>
<li>Brooks 无疑是比赛的发起者，我们发现他的助攻几乎包括了中锋、前锋位置的所有人（但不包括阿里扎，好像我记得有个镜头阿里扎要球，Brooks 没有理会）。</li>
<li>Battier 既是助攻的受益者，又是助攻的发起者。个人一直比较喜欢的球员，篮球智商非常高。</li>
<li>Budinger 这场比赛发挥出色，同队友给予其的帮助分不开。我们看到很多个球员对其都有直接帮助。</li>
<li>Andersen 从助攻网络关系角度看，属于一个策应型中锋，而且是由里向外策应的那类。从比赛中观察，似乎球风有些偏软（本赛季我第一次看直播比赛 ^_^）</li>
<li><span style="text-decoration: line-through;">Ariza 接受的助攻并不多，只有 Battier 的一次，其他都是给别人的助攻，和 Brooks 一样，属于个人能力比较强，擅于自己创造得分机会的球员。</span></li>
</ol>
<p>假如：</p>
<p>我是教练组成员，我提议（单从本场比赛结果看）：</p>
<ol>
<li>Brooks、Battier、Ariza、Andersen 在火箭进攻体系中位置比较重要，轮转的时候尽量保证其中的两人或三人同时在场。</li>
<li>Budinger 属于绝好的替补球员，但似乎不适合同 Battier、Hayes 同时在场。</li>
<li><span style="text-decoration: line-through;">Lowry 在组织进攻方面能力欠佳，使用上须谨慎。</span></li>
</ol>
<p>更新分割:</p>
<hr />40场比赛助攻数据同时考虑，结果有些凌乱：</p>
<p><span style="text-decoration: line-through;"><a href="http://www.bjt.name/wp-content/uploads/2010/01/hou40.png"><img class="aligncenter size-full wp-image-10529" title="hou40" src="http://www.bjt.name/wp-content/uploads/2010/01/hou40.png" alt="" width="525" height="465" /></a></span></p>
<p>注：这个赛季火箭队有一些球员实际上并没有真正的进入轮转，比如&#8221;Tracy McGrady&#8221;,&#8221;Mike Harris&#8221;,&#8221;Jermaine Taylor&#8221;,&#8221;Pops Mensah-Bonsu&#8221;,&#8221;Brian Cook&#8221;。虽然有些球员（比如麦蒂）的确对球队的（被）助攻仍有帮助，但贡献非常有限。出于结果整洁性的考虑，上图已将这些球员因素剔除。</p>
<p>由于绘图算法使用的是 <a href="http://en.wikipedia.org/wiki/Force-based_algorithms" target="_blank">Force-based_algorithms</a>，也就是说这种算法做出的图，边（edges）会尽可能的少。解释为，对球员关系的影响就是：</p>
<p><strong>同其他球员关系比较多的球员将绘制的比较靠近中心，而关系较少的球员会绘制在相对靠外的位置。</strong></p>
<p>重新观察火箭队助攻网络图，发现：</p>
<p>1月16日对热火比赛中，Kyle Lowry 和 Trevor Ariza 发挥的确出了问题，尤其是 Lowry 这点上。</p>
<p>如果我们求解这个网络中各个球员的<a href="http://en.wikipedia.org/wiki/Page_rank" target="_blank"> page rank</a> 值，可以认为是每个球员同其他球员助攻的关键程度。</p>
<table border="1">
<tbody>
<tr>
<th></th>
<th> Name</th>
<th> PageRank</th>
</tr>
<tr>
<td align="right">1</td>
<td>Aaron Brooks</td>
<td align="right">0.1690</td>
</tr>
<tr>
<td align="right">2</td>
<td>Trevor Ariza</td>
<td align="right">0.1496</td>
</tr>
<tr>
<td align="right">5</td>
<td>Luis Scola</td>
<td align="right">0.1334</td>
</tr>
<tr>
<td align="right">3</td>
<td>Kyle Lowry</td>
<td align="right">0.1268</td>
</tr>
<tr>
<td align="right">7</td>
<td>Shane Battier</td>
<td align="right">0.1099</td>
</tr>
<tr>
<td align="right">8</td>
<td>Carl Landry</td>
<td align="right">0.0966</td>
</tr>
<tr>
<td align="right">9</td>
<td>Chase Budinger</td>
<td align="right">0.0741</td>
</tr>
<tr>
<td align="right">4</td>
<td>Chuck Hayes</td>
<td align="right">0.0724</td>
</tr>
<tr>
<td align="right">6</td>
<td>David Andersen</td>
<td align="right">0.0681</td>
</tr>
</tbody>
</table>
<p>Brooks、Ariza、Scola、Lowry、Battier 在助攻重要性角度上，占据球队的前五位。如何使用“田忌赛马”的策略制胜，则是教练组的问题。</p>
<p>让我欣慰的是 Hayes 的重要程度要比 Andersen 要好，单单从上一场比赛上看，Andersen 发挥的有些超常。</p>
<p>P.S. 维基百科上没有区别 “有向网络”和“无向网络”的 page rank ，上个表中的 page rank 值属于“无向网络”值，同上面的图略有区别（有向网络中，Lowry 的关键性仅比 Hayes 高，有些无奈）。<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2009/04/hou-vs-lal-fieldgoal%ef%bc%89/' title='投篮点和命中率（2009-04-04 HOU vs. LAL）'>投篮点和命中率（2009-04-04 HOU vs. LAL）</a></li>
<li><a href='http://www.bjt.name/2009/03/%e4%bb%8e%e6%95%b0%e6%8d%ae%e7%9c%8b2008-2009%e8%b5%9b%e5%ad%a3%e7%9a%84%e7%81%ab%e7%ae%ad%e9%98%9f/' title='从数据看2008-2009赛季的火箭队'>从数据看2008-2009赛季的火箭队</a></li>
<li><a href='http://www.bjt.name/2010/01/nba-top-50-scorers-performance/' title='NBA联盟50位顶级球员的指标表现'>NBA联盟50位顶级球员的指标表现</a></li>
<li><a href='http://www.bjt.name/2009/11/thunder-ball/' title='提高双色球中奖概率'>提高双色球中奖概率</a></li>
<li><a href='http://www.bjt.name/2009/09/package-networks/' title='数量庞大的包，复杂的网络'>数量庞大的包，复杂的网络</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/01/rockets-heat-assists-network/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
