COS 上有人问过如何求1~100的素数。虽说这个问题没准就是计算机系大一新生的一道作业题,但对我这个几乎没有任何 C 编程经验的人来说,似乎还是有些挑战。花了几分钟整理了一下思路,既然素数的定义是只能被1和自身整除,那么: 1、如果第 n 个数,不能它前面的所有的数字(不包括1)整除,那么即为定义。但需要遍历所有数字,效率肯定不好。 2、如果 n 不能被 n 前面的所有素数整除的话,那么 n 应该是下一个素数(后来知道这个是算术基本定理)。 根据第二点思路,写出 R 代码:

prime2 <- function(m){
    x <- c(2,3,5,7,11)
    for(i in 13:m){
        if(!any(i%%x == 0)) x <- c(x,i)
    }
    return(x)
}

即给出前 5 个素数,而后寻找第 6 个素数;再根据 6 个素数找第 7 个;类推……;直至 n。 马上 cloud_wei 给出了另外的实现方式:glm包的 isprime 函数(这个包似乎没有 Windows 版本); 接着 jo3vul31l3 在回帖中给了最优的解法,即埃拉托斯特尼筛法

prime3<-function(m){
    x<-c(2:m) ; y<-NULL
    repeat{
        z<-x[(x%%x[1])!=0] ; y<-c(y,x[1])
        if(x[1]>sqrt(m))break
        x<-z
    }
    c(y,z)
}

在这以前我一直以为 素数 越到后面会越”稀疏”,但事实是这样(1:10000区间的素数):

第一幅图的红色线是顺手做的一个线性回归拟合线;10000以前的素数几乎是平均的出现在各个区间(breaks = 100)。

逛了逛 谢 的blog,被《Inverse Empirical Cumulative Distribution》这篇文章吸引过去……

确实当学习 stat 这么多年第一次知道 quantile 有 9种求法,诧异心情完全理解。记得写 R_FAQ_cn时,关于 fivenum 和 summary 函数区别时,翻阅 quantile 函数发现了这个问题,当时自己都想呕血了。书呆子

说实话,这个问题稍好整理下,在国内发到顶级统计期刊上都不为过,有兴趣的xdjm可以考虑下。

 

© 2010 刘思喆 @ 贝吉塔行星 Suffusion WordPress theme by Sayontan Sinha