<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>刘思喆 @ 贝吉塔行星</title>
	<atom:link href="http://www.bjt.name/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.bjt.name</link>
	<description>R 语言，数据挖掘，数据可视化</description>
	<lastBuildDate>Wed, 18 Aug 2010 16:02:52 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>周末看房记</title>
		<link>http://www.bjt.name/2010/08/realestate_weekend/</link>
		<comments>http://www.bjt.name/2010/08/realestate_weekend/#comments</comments>
		<pubDate>Tue, 10 Aug 2010 14:50:23 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[经济]]></category>
		<category><![CDATA[中介]]></category>
		<category><![CDATA[房地产]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10671</guid>
		<description><![CDATA[上周末一时无聊，跟朋友跑去看房子。回来总结一下，当作经验和大家分享一下。现在这年代，看房子主角向来都是职业顾问（俗称中介），跟中介打交道，斗智斗勇那是相当有意思！回想起来，看房子的过程，几乎可以说是一部部大片的集合！且请听我细细道来： ## 看房子的地带有些远，通州九棵树附近（北京除了五棵松以外，还有九棵树，囧） ## 因为不是自己买房子，所以心态比较随意。等我睡饱爬起，吃过早饭，收拾妥当已然11点有余。慢条斯理的奔向长椿街，记录了一下从长椿街到九棵树的地铁运行时间，差不多1小时。出轻轨，打黑车，果然被黑之，忍之…… 奔向朋友看中的房子，留意了一下小区的环境——环境确实非常不错，低密度6层板楼，让人很放松的感觉。房主是个搞艺术的，内部装修非常有品位，当听到中介MM说物业费是每月0.9元时，我自己差点没忍不住，要出手。 警匪篇 我见到的第二波中介一行有5个，其中三个男的，各个满脸横肉，凶神恶煞一般，若不是说带我们去看房子，我还真把他们当成劫匪了。不过最让我纳闷的是，总共就我们3个看房的，来5个中介陪同，兴师动众。搞得卖房的业主开门时都愣了，明显提高了警觉（估计当时想的是不是抢劫）。 这段时间中介日子不好过，真热情啊～～ 科技篇 第三波中介是店长加助理组合（一个中介店面会有3、4个店长），店长颇能侃，一边走一边胡扯，其实聊的和房子没点实际关系。更牛的是，最后一套房子也没给我们看，直接把我们忽悠到他店里了，现在想想也纳闷的很，怎么当时就听他的了。 最奇怪的是，进到他们的店里，我们3人的手机全没信号。本来，一路上不同的中介给我们通电话，突然手机没了信号，没有电话可接，相当不习惯。中介谈生意的手段非常高明：许诺我们中意的那套房子的业主30分钟必到，马上可以进入真刀真枪的划价阶段。然而30分钟过后……中介解释为：在路上，再等30分钟……又一个30分钟过去，中介解释：下班点，路上，有些堵（周日，囧），再等一刻钟……仍没到，解释：手机打不通了！不信你听听～～再等5分钟……演的真像，绝对不亚于我们敬爱的影帝爷爷。 就这样从4点半耗到了7点。事后我又看了看别人看房经历，发现中介店里都会有个房间可以屏蔽手机信号的，为什么把我们拉到店里，恐怕是不想让别的中介从抢走这单生意吧（高科技成就业务，真NB了）。 惊悚篇 第四波中介是两小伙儿，其中的一个文质彬彬，颇有好感。路上，聊到我们刚刚看的一套房子，中介告诉我们，那是小区里最便宜的一套。而后问我们，上一波的中介有没有告诉我们便宜的原因。当时我就冒疑问了，里面还有文章？ 中介小伙儿说，你们没看到他们正对楼下的红垫子么？没觉得有问题？我心说了，估计可能要说屋里面有人去世之类的话题，不过也很正常么。但后来，中介小伙儿说的话还是让我打了个冷战： “这楼下住了个老头，就一个人儿，有天直接挂在屋里了，但也没人知道。过了一个月，天气炎热，尸体腐烂，散发出恶臭才被邻居发现……后来医院过来人，整个楼都是福尔马林消毒水。上面的住户受不了，想快速出手……” 惊悚归惊悚，我其实是对着老头的子女是很有看法的。老头就一个人，不在身边照顾就罢了，电话也不勤着点打。真是林子大了，什么鸟都有。 后编 中介MM，中介GG都太牛了，坐在屋里谈费用的时候，手里只用一台20元的计算器完全搞定。嘴里还念叨着，这我们可以给你避税，这儿我们有优惠…… 我还好事了一下，提议搞个Excel表，把房价输入，生成明细单，你我这边都省时间。结果被中介鄙视了一下，理由是周围政策环境变化是很快的，这东西只能装脑子里（言外之意，只能意会不能言传，额……） 据中介说，买房子有个费用叫“代书费”，是北京建委收的，收费的缘由是要求网签，而网签是由建委“代书”的，故要收这一笔。问题是，这笔费用不是常量，而是房价×0.5%，也是一笔不小的银子。我没忍住又好事了一把，搜了一下所谓的“代书费”，原来又是中介巧立名目。实际是“10元工本费和80元手续费”。 额，这中介也太无良了吧！ 相关文章： 北京房地产网上签约情况 房地产泡沫？- 得瞅瞅了！]]></description>
			<content:encoded><![CDATA[<p>上周末一时无聊，跟朋友跑去看房子。回来总结一下，当作经验和大家分享一下。现在这年代，看房子主角向来都是职业顾问（俗称中介），跟中介打交道，斗智斗勇那是相当有意思！回想起来，看房子的过程，几乎可以说是一部部大片的集合！且请听我细细道来：</p>
<p>## 看房子的地带有些远，通州九棵树附近（北京除了五棵松以外，还有九棵树，囧） ##</p>
<p>因为不是自己买房子，所以心态比较随意。等我睡饱爬起，吃过早饭，收拾妥当已然11点有余。慢条斯理的奔向长椿街，记录了一下从长椿街到九棵树的地铁运行时间，差不多1小时。出轻轨，打黑车，果然被黑之，忍之……</p>
<p>奔向朋友看中的房子，留意了一下小区的环境——环境确实非常不错，低密度6层板楼，让人很放松的感觉。房主是个搞艺术的，内部装修非常有品位，当听到中介MM说物业费是每月0.9元时，我自己差点没忍不住，要出手。</p>
<h2>警匪篇</h2>
<p>我见到的第二波中介一行有5个，其中三个男的，各个满脸横肉，凶神恶煞一般，若不是说带我们去看房子，我还真把他们当成劫匪了。不过最让我纳闷的是，总共就我们3个看房的，来5个中介陪同，兴师动众。搞得卖房的业主开门时都愣了，明显提高了警觉（估计当时想的是不是抢劫）。</p>
<p>这段时间中介日子不好过，真热情啊～～</p>
<h2>科技篇</h2>
<p>第三波中介是店长加助理组合（一个中介店面会有3、4个店长），店长颇能侃，一边走一边胡扯，其实聊的和房子没点实际关系。更牛的是，最后一套房子也没给我们看，直接把我们忽悠到他店里了，现在想想也纳闷的很，怎么当时就听他的了。</p>
<p>最奇怪的是，进到他们的店里，我们3人的手机全没信号。本来，一路上不同的中介给我们通电话，突然手机没了信号，没有电话可接，相当不习惯。中介谈生意的手段非常高明：许诺我们中意的那套房子的业主30分钟必到，马上可以进入真刀真枪的划价阶段。然而30分钟过后……中介解释为：在路上，再等30分钟……又一个30分钟过去，中介解释：下班点，路上，有些堵（周日，囧），再等一刻钟……仍没到，解释：手机打不通了！不信你听听～～再等5分钟……演的真像，绝对不亚于我们敬爱的影帝爷爷。</p>
<p>就这样从4点半耗到了7点。事后我又看了看别人看房经历，发现中介店里都会有个房间可以屏蔽手机信号的，为什么把我们拉到店里，恐怕是不想让别的中介从抢走这单生意吧（高科技成就业务，真NB了）。</p>
<h2>惊悚篇</h2>
<p>第四波中介是两小伙儿，其中的一个文质彬彬，颇有好感。路上，聊到我们刚刚看的一套房子，中介告诉我们，那是小区里最便宜的一套。而后问我们，上一波的中介有没有告诉我们便宜的原因。当时我就冒疑问了，里面还有文章？</p>
<p>中介小伙儿说，你们没看到他们正对楼下的红垫子么？没觉得有问题？我心说了，估计可能要说屋里面有人去世之类的话题，不过也很正常么。但后来，中介小伙儿说的话还是让我打了个冷战：</p>
<p>“这楼下住了个老头，就一个人儿，有天直接挂在屋里了，但也没人知道。过了一个月，天气炎热，尸体腐烂，散发出恶臭才被邻居发现……后来医院过来人，整个楼都是福尔马林消毒水。上面的住户受不了，想快速出手……”</p>
<p>惊悚归惊悚，我其实是对着老头的子女是很有看法的。老头就一个人，不在身边照顾就罢了，电话也不勤着点打。真是林子大了，什么鸟都有。</p>
<h2>后编</h2>
<p>中介MM，中介GG都太牛了，坐在屋里谈费用的时候，手里只用一台20元的计算器完全搞定。嘴里还念叨着，这我们可以给你避税，这儿我们有优惠……</p>
<p>我还好事了一下，提议搞个Excel表，把房价输入，生成明细单，你我这边都省时间。结果被中介鄙视了一下，理由是周围政策环境变化是很快的，这东西只能装脑子里（言外之意，只能意会不能言传，额……）</p>
<p>据中介说，买房子有个费用叫“代书费”，是北京建委收的，收费的缘由是要求网签，而网签是由建委“代书”的，故要收这一笔。问题是，这笔费用不是常量，而是房价×0.5%，也是一笔不小的银子。我没忍住又好事了一把，搜了一下所谓的“代书费”，原来又是中介巧立名目。实际是“10元工本费和80元手续费”。</p>
<p>额，这中介也太无良了吧！<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2010/03/beijing-real-estate-contracts/' title='北京房地产网上签约情况'>北京房地产网上签约情况</a></li>
<li><a href='http://www.bjt.name/2009/06/real-estate-bubble-data-beijing/' title='房地产泡沫？- 得瞅瞅了！'>房地产泡沫？- 得瞅瞅了！</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/08/realestate_weekend/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>第三届中国R语言会议培训材料</title>
		<link>http://www.bjt.name/2010/06/3rd-chinese-r-trainning/</link>
		<comments>http://www.bjt.name/2010/06/3rd-chinese-r-trainning/#comments</comments>
		<pubDate>Sun, 27 Jun 2010 12:18:15 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[杂七杂八]]></category>
		<category><![CDATA[COS]]></category>
		<category><![CDATA[R 语言]]></category>
		<category><![CDATA[training]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10668</guid>
		<description><![CDATA[自第三届中国R语言会议至今，已经有些时日了。说想把培训材料再好好整理一下，无奈项目比较紧张，只好简单修改了下。回顾材料——发现写的少，讲的多…… 闲话少说，下面是材料的链接：slides 版本和 print 版本。 相关文章： 中国 R 语言会议（上海）趣闻 Oracle数据库开始支持R语言 闲聊R 第二届中国 R 语言会议（北京）随笔 学术圈子真的很小]]></description>
			<content:encoded><![CDATA[<p>自第三届中国R语言会议至今，已经有些时日了。说想把培训材料再好好整理一下，无奈项目比较紧张，只好简单修改了下。回顾材料——发现写的少，讲的多……<br />
闲话少说，下面是材料的链接：<a href="http://www.bjt.name/wp-content/uploads/2010/06/presentation.pdf">slides</a> 版本和<a href="http://www.bjt.name/wp-content/uploads/2010/06/print_version.pdf"> print</a> 版本。</p>
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2009/12/r-conference-shanghai/' title='中国 R 语言会议（上海）趣闻'>中国 R 语言会议（上海）趣闻</a></li>
<li><a href='http://www.bjt.name/2010/06/oracle-data-mining-r/' title='Oracle数据库开始支持R语言'>Oracle数据库开始支持R语言</a></li>
<li><a href='http://www.bjt.name/2010/03/something-about-r/' title='闲聊R'>闲聊R</a></li>
<li><a href='http://www.bjt.name/2009/12/r-conference-beijing/' title='第二届中国 R 语言会议（北京）随笔'>第二届中国 R 语言会议（北京）随笔</a></li>
<li><a href='http://www.bjt.name/2009/12/academic-surprise/' title='学术圈子真的很小'>学术圈子真的很小</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/06/3rd-chinese-r-trainning/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Oracle数据库开始支持R语言</title>
		<link>http://www.bjt.name/2010/06/oracle-data-mining-r/</link>
		<comments>http://www.bjt.name/2010/06/oracle-data-mining-r/#comments</comments>
		<pubDate>Tue, 08 Jun 2010 15:41:51 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[数据挖掘]]></category>
		<category><![CDATA[datamining]]></category>
		<category><![CDATA[Oracle]]></category>
		<category><![CDATA[R 语言]]></category>
		<category><![CDATA[甲骨文]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10654</guid>
		<description><![CDATA[一则令人兴奋的简讯： 据Oracle官方博客 最近更新的 New R Interface to Oracle Data Mining Available for Download，甲骨文开始正式支持R语言在Oracle数据库中的应用（简单的非官方说法是：甲骨文贡献了一个提供Oracle和R之间接口的附加包）。 援引博客中对R-ODM(R-Oracle Data Mining)的介绍： R-ODM is especially useful for: Quick prototyping of vertical or domain-based applications where the Oracle Database supports the application Scripting of &#8220;production&#8221; data mining methodologies Customizing graphics of ODM data mining results (examples: classification, regression, anomaly detection) 众所周知，R在实现原型算法方面有着不可替代的巨大优势。诚然，通过R实现的一般性数据挖掘算法都可以嵌入到数据库中，但Oracle提供的这个接口，极大地提高了挖掘算法的部署效率。 今天（2010.06.08），CRAN上更新了RODM包的1.0-2版本，支持Windows、Linux、MacOS X系统。 下面是RODM包帮助文档中的一个例子，可以初步地体会算法高效的部署： ### <a href='http://www.bjt.name/2010/06/oracle-data-mining-r/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>一则令人兴奋的简讯：</p>
<p>据<a href="http://blogs.oracle.com/" target="_blank">Oracle官方博客</a> 最近更新的 <a href="http://blogs.oracle.com/datamining/2010/05/new_r_interface_to_oracle_data_mining_available_for_download.html" target="_self">New R Interface to Oracle Data Mining Available for Download</a>，甲骨文开始正式支持R语言在Oracle数据库中的应用（简单的非官方说法是：甲骨文贡献了一个提供Oracle和R之间接口的附加包）。</p>
<p>援引博客中对R-ODM(R-Oracle Data Mining)的介绍：</p>
<p>R-ODM is especially useful for:</p>
<ul>
<li>Quick prototyping of vertical or domain-based applications where the Oracle Database supports the application</li>
<li>Scripting of &#8220;production&#8221; data mining methodologies</li>
<li>Customizing graphics of ODM data mining results (examples: <a href="http://www.oracle.com/technology/products/bi/odm/images/rodm_classification.jpg">classification</a>, <a href="http://www.oracle.com/technology/products/bi/odm/images/rodm_regression.jpg">regression</a>, <a href="http://www.oracle.com/technology/products/bi/odm/images/rodm_anomaly_detection.jpg">anomaly detection</a>)</li>
</ul>
<p>众所周知，R在实现原型算法方面有着不可替代的巨大优势。诚然，通过R实现的一般性数据挖掘算法都可以嵌入到数据库中，但Oracle提供的这个接口，极大地提高了挖掘算法的部署效率。</p>
<p>今天（2010.06.08），<a href="http://cran.r-project.org/" target="_self">CRAN</a>上更新了<a href="http://cran.r-project.org/web/packages/RODM/index.html" target="_self">RODM</a>包的1.0-2版本，支持Windows、Linux、MacOS X系统。</p>
<p>下面是RODM包帮助文档中的一个例子，可以初步地体会算法高效的部署：</p>

<div class="wp_syntax"><div class="code"><pre class="rsplus" style="font-family:monospace;"><span style="color: #228B22;">### GLM Regression</span>
<span style="color: #228B22;">## Not run:</span>
x1 <span style="color: #080;">&lt;-</span> <span style="color: #ff0000;">2</span> <span style="color: #080;">*</span> <span style="color: #0000FF; font-weight: bold;">runif</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">200</span><span style="color: #080;">&#41;</span>
noise <span style="color: #080;">&lt;-</span> <span style="color: #ff0000;">3</span> <span style="color: #080;">*</span> <span style="color: #0000FF; font-weight: bold;">runif</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">200</span><span style="color: #080;">&#41;</span> <span style="color: #080;">-</span> <span style="color: #ff0000;">1.5</span>
y1 <span style="color: #080;">&lt;-</span> <span style="color: #ff0000;">2</span> <span style="color: #080;">+</span> <span style="color: #ff0000;">2</span><span style="color: #080;">*</span>x1 <span style="color: #080;">+</span> x1<span style="color: #080;">*</span>x1 <span style="color: #080;">+</span> noise
dataset <span style="color: #080;">&lt;-</span> <span style="color: #0000FF; font-weight: bold;">data.<span style="">frame</span></span><span style="color: #080;">&#40;</span>x1, y1<span style="color: #080;">&#41;</span>
<span style="color: #0000FF; font-weight: bold;">names</span><span style="color: #080;">&#40;</span>dataset<span style="color: #080;">&#41;</span> <span style="color: #080;">&lt;-</span> <span style="color: #0000FF; font-weight: bold;">c</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;X1&quot;</span>, <span style="color: #ff0000;">&quot;Y1&quot;</span><span style="color: #080;">&#41;</span>
RODM_create_dbms_table<span style="color: #080;">&#40;</span>DB, <span style="color: #ff0000;">&quot;dataset&quot;</span><span style="color: #080;">&#41;</span>   <span style="color: #228B22;"># Push the training table to the database</span>
&nbsp;
<span style="color: #0000FF; font-weight: bold;">glm</span> <span style="color: #080;">&lt;-</span> RODM_create_glm_model<span style="color: #080;">&#40;</span>database <span style="color: #080;">=</span> DB,    <span style="color: #228B22;"># Create ODM GLM model</span>
                             data_table_name <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;dataset&quot;</span>,
                             target_column_name <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;Y1&quot;</span>,
                             mining_function <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;regression&quot;</span><span style="color: #080;">&#41;</span>
&nbsp;
glm2 <span style="color: #080;">&lt;-</span> RODM_apply_model<span style="color: #080;">&#40;</span>database <span style="color: #080;">=</span> DB,    <span style="color: #228B22;"># Predict training data</span>
                             data_table_name <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;dataset&quot;</span>,
                             model_name <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;GLM_MODEL&quot;</span>,
                             supplemental_cols <span style="color: #080;">=</span> <span style="color: #ff0000;">&quot;X1&quot;</span><span style="color: #080;">&#41;</span>
windows<span style="color: #080;">&#40;</span>height<span style="color: #080;">=</span><span style="color: #ff0000;">8</span>, width<span style="color: #080;">=</span><span style="color: #ff0000;">12</span><span style="color: #080;">&#41;</span>
<span style="color: #0000FF; font-weight: bold;">plot</span><span style="color: #080;">&#40;</span>x1, y1, pch<span style="color: #080;">=</span><span style="color: #ff0000;">20</span>, <span style="color: #0000FF; font-weight: bold;">col</span><span style="color: #080;">=</span><span style="color: #ff0000;">&quot;blue&quot;</span><span style="color: #080;">&#41;</span>
<span style="color: #0000FF; font-weight: bold;">points</span><span style="color: #080;">&#40;</span>x<span style="color: #080;">=</span>glm2$model.<span style="">apply</span>.<span style="">results</span><span style="color: #080;">&#91;</span>, <span style="color: #ff0000;">&quot;X1&quot;</span><span style="color: #080;">&#93;</span>,
       glm2$model.<span style="">apply</span>.<span style="">results</span><span style="color: #080;">&#91;</span>, <span style="color: #ff0000;">&quot;PREDICTION&quot;</span><span style="color: #080;">&#93;</span>, pch<span style="color: #080;">=</span><span style="color: #ff0000;">20</span>, <span style="color: #0000FF; font-weight: bold;">col</span><span style="color: #080;">=</span><span style="color: #ff0000;">&quot;red&quot;</span><span style="color: #080;">&#41;</span>
<span style="color: #0000FF; font-weight: bold;">legend</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">0.5</span>, <span style="color: #ff0000;">9</span>, <span style="color: #0000FF; font-weight: bold;">legend</span> <span style="color: #080;">=</span> <span style="color: #0000FF; font-weight: bold;">c</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;actual&quot;</span>, <span style="color: #ff0000;">&quot;GLM regression&quot;</span><span style="color: #080;">&#41;</span>, pch <span style="color: #080;">=</span> <span style="color: #0000FF; font-weight: bold;">c</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">20</span>, <span style="color: #ff0000;">20</span><span style="color: #080;">&#41;</span>,
                <span style="color: #0000FF; font-weight: bold;">col</span> <span style="color: #080;">=</span> <span style="color: #0000FF; font-weight: bold;">c</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;blue&quot;</span>, <span style="color: #ff0000;">&quot;red&quot;</span><span style="color: #080;">&#41;</span>,
                pt.<span style="">bg</span> <span style="color: #080;">=</span>  <span style="color: #0000FF; font-weight: bold;">c</span><span style="color: #080;">&#40;</span><span style="color: #ff0000;">&quot;blue&quot;</span>, <span style="color: #ff0000;">&quot;red&quot;</span><span style="color: #080;">&#41;</span>, cex <span style="color: #080;">=</span> <span style="color: #ff0000;">1.20</span>, pt.<span style="">cex</span><span style="color: #080;">=</span><span style="color: #ff0000;">1.5</span>, bty<span style="color: #080;">=</span><span style="color: #ff0000;">&quot;n&quot;</span><span style="color: #080;">&#41;</span>
&nbsp;
RODM_drop_model<span style="color: #080;">&#40;</span>DB, <span style="color: #ff0000;">&quot;GLM_MODEL&quot;</span><span style="color: #080;">&#41;</span>            <span style="color: #228B22;"># Drop the model</span>
RODM_drop_dbms_table<span style="color: #080;">&#40;</span>DB, <span style="color: #ff0000;">&quot;dataset&quot;</span><span style="color: #080;">&#41;</span>   <span style="color: #228B22;"># Drop the database table</span>
RODM_close_dbms_connection<span style="color: #080;">&#40;</span>DB<span style="color: #080;">&#41;</span>
RODM_close_dbms_connection<span style="color: #080;">&#40;</span>DB<span style="color: #080;">&#41;</span></pre></div></div>

<blockquote><p>说一句题外话：<br />
R的影响力除了在统计分析领域（SAS、SPSS、Statistica已经都开始支持R接口）外，已然发展到了商业数据库领域。</p></blockquote>
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2009/05/kdnuggets-datamining-survey/' title='KDnuggets 关于数据挖掘软件的调查'>KDnuggets 关于数据挖掘软件的调查</a></li>
<li><a href='http://www.bjt.name/2009/07/welfare-lottery-justice/' title='从一等奖出现的概率看中国福利彩票的公正性'>从一等奖出现的概率看中国福利彩票的公正性</a></li>
<li><a href='http://www.bjt.name/2009/04/hoopchina-single-index-yaoming/' title='关于在hoopchina上发帖的回答'>关于在hoopchina上发帖的回答</a></li>
<li><a href='http://www.bjt.name/2009/12/r-conference-shanghai/' title='中国 R 语言会议（上海）趣闻'>中国 R 语言会议（上海）趣闻</a></li>
<li><a href='http://www.bjt.name/2009/12/r-conference-beijing/' title='第二届中国 R 语言会议（北京）随笔'>第二届中国 R 语言会议（北京）随笔</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/06/oracle-data-mining-r/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>闲聊R</title>
		<link>http://www.bjt.name/2010/03/something-about-r/</link>
		<comments>http://www.bjt.name/2010/03/something-about-r/#comments</comments>
		<pubDate>Wed, 31 Mar 2010 12:11:59 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[R 语言]]></category>
		<category><![CDATA[mindmap]]></category>
		<category><![CDATA[SAS]]></category>
		<category><![CDATA[SPSS]]></category>
		<category><![CDATA[training]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10640</guid>
		<description><![CDATA[上周在部门内部做了一个小规模的R相关培训，大致把R的整体构架和特点做了个综述。聊得非常随意，天马行空。在这里，贴出概要（下图）和大家一起分享： （顺序是：从右至左，由上至下） 红色是重点讲的部分，当然还穿插了一些关于R的八卦：比如R和SPSS、SAS之间的故事……。我发现大家对“八卦”还是相当感兴趣的：） 相关文章： KDnuggets 关于数据挖掘软件的调查 SPSS 创立者 Norman Nie 加入 R 社区 IBM 花费 12 亿美元收购 SPSS SPSS 重塑金身]]></description>
			<content:encoded><![CDATA[<p>上周在部门内部做了一个小规模的R相关培训，大致把R的整体构架和特点做了个综述。聊得非常随意，天马行空。在这里，贴出概要（下图）和大家一起分享：</p>
<p>（顺序是：从右至左，由上至下）</p>
<p style="text-align: center;"><a href="http://www.bjt.name/wp-content/uploads/2010/03/R-简介.png"><img class="size-full wp-image-10641 aligncenter" title="R 简介" src="http://www.bjt.name/wp-content/uploads/2010/03/R-简介.png" alt="" width="879" height="631" /></a></p>
<p>红色是重点讲的部分，当然还穿插了一些关于R的八卦：比如R和SPSS、SAS之间的故事……。我发现大家对“八卦”还是相当感兴趣的：）<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2009/05/kdnuggets-datamining-survey/' title='KDnuggets 关于数据挖掘软件的调查'>KDnuggets 关于数据挖掘软件的调查</a></li>
<li><a href='http://www.bjt.name/2009/10/spss-norman-nie-r/' title='SPSS 创立者 Norman Nie 加入 R 社区'>SPSS 创立者 Norman Nie 加入 R 社区</a></li>
<li><a href='http://www.bjt.name/2009/07/ibm-spss-acquisition/' title='IBM 花费 12 亿美元收购 SPSS'>IBM 花费 12 亿美元收购 SPSS</a></li>
<li><a href='http://www.bjt.name/2009/04/spss-pasw/' title='SPSS 重塑金身'>SPSS 重塑金身</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/03/something-about-r/feed/</wfw:commentRss>
		<slash:comments>9</slash:comments>
		</item>
		<item>
		<title>北京房地产网上签约情况</title>
		<link>http://www.bjt.name/2010/03/beijing-real-estate-contracts/</link>
		<comments>http://www.bjt.name/2010/03/beijing-real-estate-contracts/#comments</comments>
		<pubDate>Thu, 04 Mar 2010 11:20:22 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[经济]]></category>
		<category><![CDATA[北京]]></category>
		<category><![CDATA[房价]]></category>
		<category><![CDATA[房地产]]></category>
		<category><![CDATA[翻墙]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10629</guid>
		<description><![CDATA[最近两会期间，房地产又一次成为焦点中的焦点，各位代表各抒己见，据说在政协的各项提案之中，关于房地产市场的提案几乎占据半壁江山。 房价涨与不涨，各位代表是各抒己见，有声音说北京房价2年内会涨到4万，而且还有佐证。当然俺们的总理最近5年一直在说这事，童鞋可移步这里，当然还有一张漫画，这里就不贴了，太不Harmany。若感兴趣可以使用 blogtd + 总理姓名 google 之（可能得翻墙出去）。 人家说啥都不如自己看看，来点实际的。关注一下最近几年北京房地产市场每天网上（期房、存量房）签约的套数。 （首先声明，房地产市场比较复杂，比如官啊、商啊、摇号啊、中介啊、银行啊、炒房团啊，空军、多军……指标忒多，所以我一直也没搞太明白。搞不明白也想凑一凑热闹，与时俱进嘛！扔两张图上来，大家笑笑） 2008年9月1日至今的期房（不包含经适房、限价房）签约情况： 其中的时点数据不包括： 2009.01.25 &#8211; 2009.02.01 春节 2009.11.02，2010.01.10，2010.01.16 调试 2010.02.13 &#8211; 2010.2.19 春节 如果只看2008年后半年，会发现其实每天签约的期房数量也不是很多，一直都在100套左右。不过在年底的时候，随着第一次楼盘降价潮的来临，部分刚需释放，期房签约的数量要明显高于平日。 假设2008年是期房市场正常年的话，那么2009年几乎可以用“疯狂”二字来标记北京的期房市场。每天平均400套的签约数量，动辄200、300万的房价，都贵成这样了，被谁买去啦？ 然后是北京存量房签约情况： （不知为何，北京房地场交易网没有2008年9月1日至2008年10月14日数据。） 存量房签约的情况大致和期房签约变化一致。同样是2008年的数量比较小，而到了2009年，市场开始癫狂。不过存量房签约套数变化有点意思: 似乎有个周期变化，猜测是人为因素； 2009年末受相关优惠政策影响，签约量的确比较生猛。 以前我一直以为大家一般都会去买期房，原来实际的情况是，这几年存量房卖的比期房要好很多。从存量房签约的数量上看，北京可售商品房数量一直在减少这也是必然的，也就应了一些媒体说的，“北京可售商品房越来越少，房子的稀缺将进一步带动房价的上涨。” 但从买卖双方博弈角度来说：可售商品房的减少，很有可能是因为大部分投机客获利，大规模离场的原因。但，可惜的是我们没有进一步数据进行分析…… 最后是数据——期房，存量房。二者除了套数数据以外，还包括面积。在期房数据中包括的后两项为经适房、两限房；存量房数据分为合计、服务窗口签约、经纪机构签约、交易保证机构签约。 相关文章： 房地产泡沫？- 得瞅瞅了！]]></description>
			<content:encoded><![CDATA[<p>最近两会期间，房地产又一次成为焦点中的焦点，各位代表各抒己见，据说在政协的各项提案之中，关于房地产市场的提案几乎占据半壁江山。</p>
<p>房价涨与不涨，各位代表是各抒己见，有声音说北京房价2年内会<a href="http://house.focus.cn/news/2010-03-05/870811.html" target="_blank">涨到4万</a>，而且还有<a href="http://news.sohu.com/20100304/n270562281.shtml" target="_blank">佐证</a>。当然俺们的总理最近5年一直在说这事，童鞋可移步<a href="http://blog.mysupa.com/journal/237014.html" target="_self">这里</a>，当然还有一张漫画，这里就不贴了，太不Harmany。若感兴趣可以使用 blogtd + 总理姓名 google 之（可能得翻墙出去）。</p>
<p>人家说啥都不如自己看看，来点实际的。关注一下最近几年北京房地产市场每天网上（期房、存量房）签约的套数。</p>
<p>（首先声明，房地产市场比较复杂，比如官啊、商啊、摇号啊、中介啊、银行啊、炒房团啊，空军、多军……指标忒多，所以我一直也没搞太明白。搞不明白也想凑一凑热闹，与时俱进嘛！扔两张图上来，大家笑笑）</p>
<p>2008年9月1日至今的期房（不包含经适房、限价房）签约情况：</p>
<p style="text-align: center;"><a href="http://www.bjt.name/wp-content/uploads/2010/03/amount1.png" target="_blank"><img class="size-full wp-image-10631 aligncenter" title="amount1" src="http://www.bjt.name/wp-content/uploads/2010/03/amount1.png" alt="" width="800" height="600" /></a></p>
<div id="_mcePaste">其中的时点数据不包括：</div>
<div>
<ol>
<li>2009.01.25 &#8211; 2009.02.01 春节</li>
<li>2009.11.02，2010.01.10，2010.01.16 调试</li>
<li>2010.02.13 &#8211; 2010.2.19 春节</li>
</ol>
</div>
<div>如果只看2008年后半年，会发现其实每天签约的期房数量也不是很多，一直都在100套左右。不过在年底的时候，随着第一次楼盘降价潮的来临，部分刚需释放，期房签约的数量要明显高于平日。</div>
<div>假设2008年是期房市场正常年的话，那么2009年几乎可以用“疯狂”二字来标记北京的期房市场。每天平均400套的签约数量，动辄200、300万的房价，都贵成这样了，被谁买去啦？</div>
<div><span id="more-10629"></span></div>
<div>然后是北京存量房签约情况：</div>
<div><a href="http://www.bjt.name/wp-content/uploads/2010/03/amount2.png"><img class="size-full wp-image-10630 aligncenter" title="amount2" src="http://www.bjt.name/wp-content/uploads/2010/03/amount2.png" alt="" width="800" height="600" /></a></div>
<p>（不知为何，北京房地场交易网没有2008年9月1日至2008年10月14日数据。）</p>
<p>存量房签约的情况大致和期房签约变化一致。同样是2008年的数量比较小，而到了2009年，市场开始癫狂。不过存量房签约套数变化有点意思:</p>
<ol>
<li>似乎有个周期变化，猜测是人为因素；</li>
<li>2009年末受相关优惠政策影响，签约量的确比较生猛。</li>
</ol>
<p>以前我一直以为大家一般都会去买期房，原来实际的情况是，这几年存量房卖的比期房要好很多。从存量房签约的数量上看，北京可售商品房数量一直在减少这也是必然的，也就应了一些媒体说的，“北京可售商品房越来越少，房子的稀缺将进一步带动房价的上涨。”</p>
<p>但从买卖双方博弈角度来说：可售商品房的减少，很有可能是因为大部分投机客获利，大规模离场的原因。但，可惜的是我们没有进一步数据进行分析……</p>
<p>最后是数据——<a href="http://www.bjt.name/wp-content/uploads/2010/03/data1.csv" target="_blank">期房</a>，<a href="http://www.bjt.name/wp-content/uploads/2010/03/data2.csv" target="_blank">存量房</a>。二者除了套数数据以外，还包括面积。在期房数据中包括的后两项为经适房、两限房；存量房数据分为合计、服务窗口签约、经纪机构签约、交易保证机构签约。<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li><a href='http://www.bjt.name/2009/06/real-estate-bubble-data-beijing/' title='房地产泡沫？- 得瞅瞅了！'>房地产泡沫？- 得瞅瞅了！</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/03/beijing-real-estate-contracts/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>用LaTeX放大pdf文档</title>
		<link>http://www.bjt.name/2010/03/latex-pdfpages/</link>
		<comments>http://www.bjt.name/2010/03/latex-pdfpages/#comments</comments>
		<pubDate>Mon, 01 Mar 2010 01:39:48 +0000</pubDate>
		<dc:creator>刘思喆</dc:creator>
				<category><![CDATA[LaTeX]]></category>
		<category><![CDATA[ESLII]]></category>
		<category><![CDATA[hastie]]></category>
		<category><![CDATA[pdfpages]]></category>

		<guid isPermaLink="false">http://www.bjt.name/?p=10560</guid>
		<description><![CDATA[2009年12月，hastie教授主页上更新了勘误后的The Elements of Statistical Learning II。这部机器学习领域的巨著，做数据挖掘或者统计分析的同行应该比较熟悉，不过这本书在美帝的 Amason 上要卖 80$，非常不符合中国特色的社会主义！ 好在 Hastie 几位大牛深刻体会广大发展中国家莘莘学子的购买能力，在其主页上提供了免费的pdf版本。不过pdf版本有个小问题：排版是为了a4打印而设计的，白边太多，在电脑上看或者打印出来极为不爽。 下面提供一个解决方案来处理这个问题——使用LaTeX中的pdfpages宏包。 具体LaTeX代码参考如下： \documentclass[a4paper,12pt]{report} \usepackage[final]{pdfpages} \begin{document} \includepdf[pages=19-26, scale=1.3, delta=0mm 5mm, frame]{ESLII_print3.pdf} \end{document} \endinput 使用PDF LaTeX编译。 主要参数非常简单，即从ESLII_print3.pdf中提取第19至26页（第一章），并放大1.3倍（成功剔除掉多余的白边）。 相关文章： 没有了，随便看看吧 ^_^]]></description>
			<content:encoded><![CDATA[<p>2009年12月，hastie教授主页上更新了勘误后的The Elements of Statistical Learning II。这部机器学习领域的巨著，做数据挖掘或者统计分析的同行应该比较熟悉，不过这本书在美帝的 Amason 上要卖 80$，非常不符合中国特色的社会主义！</p>
<p>好在 Hastie 几位大牛深刻体会广大发展中国家莘莘学子的购买能力，在其<a href="http://www-stat.stanford.edu/~tibs/ElemStatLearn/">主页</a>上提供了免费的pdf版本。不过pdf版本有个小问题：排版是为了a4打印而设计的，白边太多，在电脑上看或者打印出来极为不爽。</p>
<p>下面提供一个解决方案来处理这个问题——使用LaTeX中的pdfpages宏包。<br />
具体LaTeX代码参考如下：</p>

<div class="wp_syntax"><div class="code"><pre class="latex" style="font-family:monospace;"><span style="color: #E02020; ">\</span><span style="color: #800000;">documentclass</span><span style="color: #E02020; ">[</span><span style="color: #C08020; font-weight: normal;">a4paper,12pt</span><span style="color: #E02020; ">]{</span><span style="color: #2020C0; font-weight: normal;">report</span><span style="color: #E02020; ">}</span>
<span style="color: #E02020; ">\</span><span style="color: #800000;">usepackage</span><span style="color: #E02020; ">[</span><span style="color: #C08020; font-weight: normal;">final</span><span style="color: #E02020; ">]{</span><span style="color: #2020C0; font-weight: normal;">pdfpages</span><span style="color: #E02020; ">}</span>
<span style="color: #C00000; font-weight: normal;">\begin</span><span style="color: #E02020; ">{</span><span style="color: #2020C0; font-weight: normal;"><span style="color: #0000D0; font-weight: normal;">document</span></span><span style="color: #E02020; ">}</span>
<span style="color: #800000; font-weight: normal;">\includepdf</span><span style="color: #E02020; ">[</span><span style="color: #C08020; font-weight: normal;">pages=19-26, scale=1.3,
delta=0mm 5mm, frame</span><span style="color: #E02020; ">]{</span><span style="color: #2020C0; font-weight: normal;">ESLII_print3.pdf</span><span style="color: #E02020; ">}</span>
<span style="color: #C00000; font-weight: normal;">\end</span><span style="color: #E02020; ">{</span><span style="color: #2020C0; font-weight: normal;"><span style="color: #0000D0; font-weight: normal;">document</span></span><span style="color: #E02020; ">}</span>
<span style="color: #800000; font-weight: normal;">\endinput</span></pre></div></div>

<p>使用PDF LaTeX编译。<br />
主要参数非常简单，即从ESLII_print3.pdf中提取第19至26页（第一章），并放大1.3倍（成功剔除掉多余的白边）。<br />
<h3 class='related_post_title'>相关文章：</h3>
<ul class='related_post'>
<li>没有了，随便看看吧 ^_^</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.bjt.name/2010/03/latex-pdfpages/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
	</channel>
</rss>
