<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>刘思喆 @ 贝吉塔行星 &#187; packages</title>
	<atom:link href="http://www.bjt.name/tag/packages/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.bjt.name</link>
	<description>R 语言，数据挖掘，数据可视化</description>
	<lastBuildDate>Wed, 30 Nov 2011 15:43:30 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>数量庞大的包，复杂的网络</title>
		<link>http://www.bjt.name/2009/09/r-cran-package-networks/</link>
		<comments>http://www.bjt.name/2009/09/r-cran-package-networks/#comments</comments>
		<pubDate>Sat, 05 Sep 2009 08:38:54 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[R 语言]]></category>
		<category><![CDATA[图型展示]]></category>
		<category><![CDATA[CRAN]]></category>
		<category><![CDATA[networks]]></category>
		<category><![CDATA[packages]]></category>

		<guid isPermaLink="false">http://www.bjt.name/2009/09/%e6%95%b0%e9%87%8f%e5%ba%9e%e5%a4%a7%e7%9a%84%e5%8c%85%ef%bc%8c%e5%a4%8d%e6%9d%82%e7%9a%84%e7%bd%91%e7%bb%9c-2/</guid>
		<description><![CDATA[R 各个镜像中的 Contributed Packages 越来越多，截至今日，已经达到1950个，单单拉动鼠标把所有的 包名 从 A 到 Z 过一遍也得 10 几秒。随便考你一道：最后一个 R 包是啥？ zoo？ 呵呵，我的印象里一直是它，仔细瞧了瞧发现是个叫 zyp 的包。 又一次领略了 R 强大的扩展能力撒？这个特点给我们带来了一些烦恼，因为人类的大脑能够理解的概念是有限的，对于没有任何关联的概念，我们的识别能力一般不超过 7，而且 R 的涵盖范围实在太广。从我们的有限性（7个概念）和 R 的无限性这一角度讲，逐一认识这些包几乎是不可能的！不过还好，至少我们可以可以参考 CRAN 上的 Task Views，大致了解 R 包的使用方向。 我们换个思路，不是从 R 的使用方向上，而是从 R 包的依赖关系上？ 这些 R 包并不是相互独立的。比如说，MASS 包依赖于 R (&#62;= 2.5.0), grDevices, graphics, stats, utils 这些基础包；而又会有包依赖于 MASS 包，比如 yihui 的 animation <a href='http://www.bjt.name/2009/09/r-cran-package-networks/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.r-project.org">R</a> 各个镜像中的 <a href="http://ftp.ctex.org/mirrors/CRAN/web/packages/" target="_blank">Contributed Packages</a> 越来越多，截至今日，已经达到1950个，单单拉动鼠标把所有的 包名 从 A 到 Z 过一遍也得 10 几秒。随便考你一道：最后一个 R 包是啥？</p>
<p>zoo？</p>
<p>呵呵，我的印象里一直是它，仔细瞧了瞧发现是个叫 <a href="http://ftp.ctex.org/mirrors/CRAN/web/packages/zyp/index.html">zyp</a> 的包。</p>
<p>又一次领略了 R 强大的扩展能力撒？这个特点给我们带来了一些烦恼，因为人类的大脑能够理解的概念是有限的，对于没有任何关联的概念，我们的识别能力一般不超过 7，而且 R 的涵盖范围实在太广。从我们的有限性（7个概念）和 R 的无限性这一角度讲，逐一认识这些包几乎是不可能的！不过还好，至少我们可以可以参考 <a href="http://cran.r-project.org/mirrors.html" target="_blank">CRAN</a> 上的 <a href="http://ftp.ctex.org/mirrors/CRAN/web/views/" target="_blank">Task Views</a>，大致了解 R 包的使用方向。</p>
<p>我们换个思路，不是从 R 的使用方向上，而是从 R 包的依赖关系上？</p>
<p>这些 R 包并不是相互独立的。比如说，MASS 包依赖于 R (&gt;= 2.5.0), grDevices, graphics, stats, utils 这些基础包；而又会有包依赖于 MASS 包，比如 <a href="http://yihui.name/" target="_blank">yihui</a> 的 <a href="http://ftp.ctex.org/mirrors/CRAN/web/packages/animation/index.html">animation </a>，当然还有可能有包依赖于 <a href="http://ftp.ctex.org/mirrors/CRAN/web/packages/animation/index.html">animation</a> ……</p>
<p>遍历所有的包，我们就看到了一个网络，一个 <a href="http://www.r-project.org">R</a> 包的网络。</p>
<p>为了简化起见，这里忽略了同其他包没有关系的包（当然并不是完全没有关系，所有的包都和 <a href="http://www.r-project.org">R</a> 或 <a href="http://www.r-project.org">R</a> 的基础包有关，如果这样计量的话，会导致所有的包都会指向 R）。</p>
<p>首先截取了这个庞大网络的一部分：</p>
<p style="text-align: center;"><img class="aligncenter" src="http://www.bjt.name/wp-content/uploads/2009/09/sna.png" alt="sna.png" width="630" height="578" /></p>
<p>从上图我们可以看到，标记点为215、271的两个包是我们研究的包网络中的两个关键点，这两个包分别是lattice、mvtnorm。</p>
<p>关于这两个包：</p>
<ol>
<li>
<div>lattice：网格绘图的基础包。很多包基于它扩展并不惊讶吧；</div>
</li>
<li>
<div>mvtnorm：多元正态分布和t分布的概率密度函数、累计分布函数、分位数函数、分布随机数。多元分布的基础。</div>
</li>
</ol>
<p>从 271（mvtnorm）向左上，又会有一个小的聚集。那个小的聚集中心（110），是 fBasics 包，如果各位对金融领域关注的话，应该知道它在其中的地位吧。</p>
<p>当然，由于抽取的是一个子网络，很多的连接都被生硬地隔断，因此出现了大量的孤立点。</p>
<p>如果我们把 CRAN 上的1950个包都放到我们的网络中会是这样：</p>
<p style="text-align: center;"><a href="http://www.bjt.name/wp-content/uploads/2009/09/sna_black.png"><img class="aligncenter size-full wp-image-10794" title="R cran packages networks" src="http://www.bjt.name/wp-content/uploads/2009/09/sna_black.png" alt="" width="800" height="500" /></a></p>
<hr />
<p>最后说明：</p>
<ol>
<li>第一张图的 包 id 换成 包名称 会导致 演示的视觉效果很差，网页又不支持 pdf 直接显示，只好把带包名的图放这（<a href="http://www.bjt.name/wp-content/uploads/sna300.pdf">pdf</a>）。</li>
<li>带包名的 ，1950 个包的全图就算了吧，单绘图就得 2 分钟，更别提调整参数了 ……</li>
</ol>
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2011/05/baidu-singers-relationships/' title='百度如是说——中国两百强流行歌手关系'>百度如是说——中国两百强流行歌手关系</a></li>
<li><a href='http://www.bjt.name/2010/01/rockets-heat-assists-network/' title='火箭对热火比赛（20100116）中，火箭球员的助攻网络关系'>火箭对热火比赛（20100116）中，火箭球员的助攻网络关系</a></li>
<li><a href='http://www.bjt.name/2008/07/%e5%a4%8d%e6%9d%82%e7%9a%84%e5%85%b3%e7%b3%bb%e5%9b%be/' title='复杂的关系图'>复杂的关系图</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2009/09/r-cran-package-networks/feed/</wfw:commentRss>
		<slash:comments>10</slash:comments>
		</item>
	</channel>
</rss>

