2011年3月11日日本福岛9.0级大地震以后,紧接着是海啸,跟着福岛核电厂接连发生爆炸。如果开始还可以说是电影《日本沉没》的剧情的话,那核电站爆炸的后果,可就有点像《生化危机》前奏的味道了。

民众对于核辐射污染的担心要远超过地震和海啸。就拿前几天国内发生的碘盐抢购事件来说,虽然主要原因是民众对政府的不信任(对比日本灾民的有序和平静),但很大的恐慌来自于人们对核辐射的危害的恐惧。

从各国对核武器的态度以及实际行动上看,核武器和核污染基本不沾边。一旦发生了核污染,那必定是和核能电站有密切关系。而这几年,我国政府既要保证高速经济增长所需要的电力能源,又要尽力控制二氧化碳排放,那大力发展核能便是上上之选了。本来这等国家大事和我等小民也没什么关系,不过上次回老家,偶然听说河北要建四座核电站,其中一座就在离我老家不足4公里的位置。枕头边上放一个随时爆炸的定时炸弹,这事不关心也不成了。随手翻了翻网上的资料,发现前期的选址和研究审批已然结束。(我等一厢情愿的认为,这种事情是应该公投的,至少要听证一下吧。从现在我周围人态度上看,肯定不可能通过。如果通过了,我们那儿将继重污染企业首钢搬迁后,又一次为伟大祖国首都——北京做的“巨大”贡献)。

核能是潘多拉盒子,这次日本的核泄漏给大陆敲响了警钟,有评论说,两会上刚刚获得通过的“十二五”规划中的核能规划后续也可能会有很大变动。和普通人一样,我也怕核辐射,更怕核辐射毁掉家园。核能电站的建设需要有极专业的考证和后续严谨的政府管理,如果我是日本人,我相信这两点。但不幸的是,我是中国(大陆)人,这两条我都不信任。一个最基本的常识上——核能电站不应该建设在地震带上。

最近花了一些时间,零零散散地收集了一些数据,附一些分析。还是那句话,我等小民虽说不能决定此等国家大事,但心里明白明白也是有必要的。

首先是世界范围,各国拥有核电站的数量:

可以看到,世界范围核电排名前四的国家分别是美国、法国、日本,俄罗斯联邦,我国排名第十,和发达国家确实有段距离;这排名前四的几个国家的核电基本都是在1970-1990时间段建设,而近十年发展速度明显降了下来。但反观中国大陆,大部分核能电站都是在2000-2010年期间修建,并且在规划中的核电站(反应堆)更多。

而从日本核电站事故上看,核能电站修建在地震多发地带是非常不明智的,即便是有多重的防护措施。我们关注一下,地震多发地带和核电站分布重合的程度。下图标记了1973年至2010年,世界范围内的1级(包含)以上地震分布(红色为实际的地震发生地点,蓝色为当年发生地震的密度),以及每年各国存量核电站(绿色点标记)的情况:

左下角的小图是1973年至今所有世界一级以上地震发生的高概率区域,从这个小图上看,日本、美国西海岸、南美洲西海岸是高发地震区域。最近发生在这三个区域的大型破坏地震有:智利2010年8.8级、日本2011年9.0级、美国加利福尼亚州2003年6.5级(不过加州的这次好像还不够,有报道说可能还会发生更大级别的地震)。

美国的大部分核电站都修建在东部地区,而在地震高发的西部地区,核能反应堆的数量明显很少,最大程度的降低了地震对核能电站的影响;而日本就比较郁闷了,整个国家都处在地震高发区上,核电站修的又很密集,出现3月11日的事件有其必然性。

那对于我国呢,不言自明:修在唐山这种时不时就震一下的地方是绝对不应该的,修的话向内陆靠一靠,离地震发生高概率区域远一些!

最后在扯一句,大地震似乎总和核爆有关系,包括中国汶川、日本福岛,随便搜一搜可以罗列关于很多核试验的传闻。也许渺小的人类看到的毁灭性的灾难都是一个样子吧。

附:数据

 

集智俱乐部是我最近两年来比较关注的俱乐部,尤其集智在三号会所的线下活动,一帮来自五湖四海、背景迥异的年轻人,因为一个共同感兴趣的主题,各抒己见(头脑风暴),过程非常奇妙。至今依然清晰的记得第一次参加集智活动时,大家对超自然(超能力)现象的热烈讨论。说实话,当时刚听完报告,还以为进入一个邪教组织了,呵呵~~

2010年12月9日,集智俱乐部的 计算士 和 Jake 发布了头脑风暴论坛数据分析报告(全文)。报告很有趣,其中讲到了 Zipf 定律和以社会网络分析为主的网络骨架图。Jake 同时将头脑风暴论坛的数据发布,数据为XML格式文件。而我,恰恰对头脑风暴论坛的兴趣也是非常浓厚,所以这边本地将这些数据处理了一下(大家可参考这里),并作了一些简单分析同大家分享。

首先是头脑风暴论坛中最为关键的几个actors:

这里考虑了两个因素,网络的 Eigenvector Centrality 和 Betweenness Centrality(即vertex和edge信息),从上图看:jake 的地位最高,且Eigenvector和Betweenness相差较小;紧随其后的是东方隐,当然这个紧随其后是指相对概念。

由于 jake 的地位(重要到有点儿离群点的意思了),其他会员的状态不是很明显,所以考虑将 jake 这点去掉:

这样处理以后,除 jake 和 东方隐 以外的用户状态浮出。如果主观上增加“第二梯队”的概念(除去jake和东方隐两人,个人对头脑风暴论坛不是很熟悉,权且这么划分。当然也可以做个聚类啥的,不折腾了),那么属于这一梯队的ID包括:zcard2000、ruiaijun、黄淼鑫、计算士、Michael0607、天狮星11、飞鸟、yywwkk等。

问题来了,论坛上这些比较重要的actors是如何组织在一起(相互作用)的呢?

上图为重要节点的网络图,不难看出:jake 在头脑风暴论坛的地位是无可替代的,牢牢地占据论坛关系中最核心的位置(估计这种结构在COS论坛也同样存在,其中的核心不用我多言,哈~~)

还有就是东方隐这个节点也非常有意思,需要关注。但详细的说明,这里就省略了,毕竟对头脑风暴论坛不像统计之都那么熟悉,硬搬着去解释,难免贻笑大方。简单陈述一下绘制关系图的原则:

  • 同计算士绘制的骨架图一样,这里也同样将一些不太重要的节点做了删除处理(subgraph),只留下了重要节点的骨架;
  • 骨架中的节点也并不是每一个都做了展示,而是通过 Eigenvector 和 Betweenness 的对比,将差异比较明显的节点做(名称)展示。而表示为红色的节点大小即为二者差异的大小。

写在最后:

  1. 这篇文章实际上写的非常仓促,有很多细节考虑不是很完备,并且从数据上看,能够展现的也不止上面的一些信息(比如发帖时间的分析、还有一些条件密度类的内容,等等)。但与其无限期放在草稿箱里,不如直接放出来。因此这篇文章可能会有比较大的改动(主要是绘图部分),但什么时候,就不得而知了;
  2. 如果有集智俱乐部的童鞋看到这篇文章的话,多多指正,并——欢迎加入统计之都
  3. 关于集智俱乐部:说太多了可能太主观,还是参考其官网的简介:

附:

2003 年,集智俱乐部创始人张江(Jake)创办了集智俱乐部网站,该网站一直致力于宣传、普及、推广复杂系统科学,并展开广泛的跨学科交流,俱乐部渐渐聚集了一批有识之士。 5 年后的 2008 ,集智俱乐部的交流和活动开始从虚拟世界走向现实,并尝试发展一个现实世界中的学术组织。目前集智俱乐部的日常管理工作由集智核心成员负责, 主要活动有开放式的讲座与交流,以及其它主题小组活动。……

 

记得高中生物课本上的彩页有一幅人类卵子和精子大小比较(下图),从那时起朦朦胧胧对这些微观世界的单位有些感知,但是这些单位具体多大?

犹他大学 有个GENETIC SCIENCE LEARNING CENTER 在 Cell size and scale 里展示了:大到咖啡豆、米粒,小到碳原子各种典型微观单位的尺寸,非常直观。它上面还提到了X 染色体和精子脑袋一般大的问题,好像有悖于一般常识。微观物质方面看得少,也不知道是 sperm 太小,还是染色体太大 :)

比较惊讶的是

  • 酵母和红细胞一般大
  • HIV 和流感病毒一般大

注:似乎这个flash只能在 IE 下观看,enjoy it!

 

有意思的一个赛季,由于赛季之初 Artest 的到来,球迷们又开始 yy 松鼠姚的总冠军之路。不过可惜,随着 T. McGrady 的报废,基本上这赛季总决赛大门又一次提前关闭。紧接着球队的主力 PG(R. Alston)被换走,今天又签下James White,我就纳闷了,为啥和火箭有关系的人我都关注过呢。 松鼠姚至今天(2009.03.05)共 28 次两双,占出场次数的 48%,场均数据并不惊艳:

  min FG FGA X3P X3PA FT FTA OREB DREB REB AST STL BLK TO PF EF PTS
  32.9 7.2 13.1 0.0 0.0 5.4 6.2 2.7 6.9 9.6 1.6 0.4 1.8 3.2 3.2 11.1 19.8

场均得分 PTS 为 19.8 分,场均篮板 REB 为 9.6 个。 离场均两双还有一点点距离,给个及格分好了。

顺便做了下对火箭球员分析,共使用了 273 个火箭球员的相关变量,得到的结论解释了我几条疑问:

rockets_player 指标我就不多说了,爱打篮球的筒子一般都知道 FG、AST、REB 这类乱七八糟的指标,要说明的是 1722 、532 这些数字是 ESPN 给 NBA 球员定义的编号,1722 就是 Y. Ming 了,其他的 532 为 T. McGrady,11 为 R. Alston,25 为 Artest ,1781 为 L. Scola ,3192 为 A. Brooks;而 1、0 则为方便记录胜负而设置的。

从图上不难找到火箭的关键球员,他们左右了每场比赛的胜负。对火箭成绩走向最关键的球员是 Y. Ming ,因为他在最根部,是决定下一个球员因素的前提(本赛季 T. McGrady 由于伤病困扰数据大幅下滑,不过从侧面说明 Y.Ming 已然是球队老大)。其他球员因素不必过多解释,数据显示结果唯一让我不满便是 S. Battier 的重要性,本来这次数据探索我就是朝着他去的,结果还是没有合适指标可以显示他的作用。再找时间做好了。

关于为什么 R. Alston 为什么会被换走,这里同样可以给大家一个清晰的解释:当 Yao 的 Field Goal 低于 5.5 时,同时 T. McGrady 的 AST 小于4.5 次时,R. Alston 的上场时间成为关键因素,不过抱歉的说,当他上场时间大于35.5 min 时,火箭会输!!估计莫雷应该用的是同样方法看到这一怪现象吧。那 R. Alston 在交易日截止之前被换走也就不难理解了。

阿德尔曼的普林斯顿体系是不是适合火箭。说实话,我也不熟。至今,我对经典的三角进攻都不知道如何开始。不过,火箭的 Team 数据(不包括20090305对爵士)可以说明一切。Exciting 的时刻来了:

rokets

  1. 如果火箭的得分(PTS)能够上到 102 分以上,那么这场比赛是拿定了。这种比赛个人认为应该是队员对教练战术执行彻底,进攻如行云流水,人挡杀人,见佛杀佛。这赛季以高于 102 的比分战胜的球队甚至包括马刺(103-84)、爵士(120-115) 等西部强队。
  2. 如果得分小于等于 102 分时,决定因素就转到防守篮板(DREB)上了。一般防守篮板小于31个时,输得概率比较高;不过即使防守篮板不济,当抢断大于10次时还是有希望得回胜利的。
  3. 得分小于 102,篮板大于 31 个,决定因素就变成了三分球试投(3PA)。只要投进三分球试投能够低于 19 个时,球队仍然可以以高概率赢得比赛(92%)。大家该冒出疑问了,为啥三分球试投数小了才能赢球,不是多了更好么。诚然从数字上看确实如此,但火箭三分多了,一般都是后卫在“浪投”,既不能对内线造成杀伤也不能迅速解决战斗。这也就是火箭从赛季之初一直在囤积后场的原因。只可惜,至今天,火箭的后场还是那么烂。

看看今天对爵士的比赛:火箭得分 94(没进攻),防守篮板 23(没防守) ,抢断为 8(没激情),你把这些数据按上图走一遍,是不是告诉你会返回 0。不输才怪!

 

Knowledge is what we know
Also, what we know we do not know.
We discover what we do not know
Essentially by what we know

Thus knowledge expands.

With more knowledge we come to know
More of what we do not know.

Thus knowledge expands endlessly.

All knowledge is, in final analysis, history.
All sciences are, in the abstract, mathematics.
All judgements are, in their rationale, statistics.


知识是我们已知的
也是我们未知的
基于已有知识之上
我们去发现未知的
由此,知识得到扩充

我们获得的知识越多
未知的知识就会更多
因而,知识的扩充永无止境

在终极的分析中,一切知识都是历史
在抽象的意义下,一切科学都是数学
在理性的基础上,所有的判断都是统计学

© 2012 刘思喆 @ 贝吉塔行星 Suffusion theme by Sayontan Sinha