建国以来人均 GDP 增长情况

发表于 2019-10-02 分类于亲历

拜川普总统所赐，今年的国庆节国人过的非常振奋。

此生无悔入华夏，来世愿在种花家

这句话说出了很多人的心声。

情怀归情怀，我们从建国以来到底 成长的怎样 呢？闲话不说，直接上图，数据来源这里。

改革开放 40 年我们取得了非常傲人的经济成就，作为 80 后亲历者，图形化的结果还是震撼了我。从 04 年附近，人均 GDP 的增幅突然爆发出了一个向上的拐点，全球第二大经济体，这么巨大的体量居然还能做到如此，真心不容易！我们大部分普通老百姓即便是什么也没有做，生活水平也在跟着水涨船高，感谢我的政府！

阅读全文 »

生成不同的网站登录密码

发表于 2019-09-28 分类于工具技巧

随着我们注册的网站和 App 越来越多，有一个问题一直困扰着我：

我的密码真心不够用！

经常几个可能密码重复的尝试，时不时网站就报超过尝试次数。以及还有一个更为可怕的风险：如果所有的网站如果使用同样的密码，任意一个网站只要发生安全泄露（这几年发生次数不少），那基本你在其他网站就属于裸奔了，其他人可以利用你的统一密码作出一系列你不能想象的行为。

1Password 给我了一些启发，它可以保证你每个网站的密码都不同。这款软件安全性怎样，收费多少先不提，我们简单思考一下这个软件的原理貌似是容易实现的，基本要素和逻辑猜测有以下要点：

不同的网站或者 app 会导致密码的不同
自己有一个私钥种子，这是唯一要保存的
将 1 和 2 的信息加密之后返回加密信息
将加密信息的内容通过一定的规则给出显式密码
显式密码包含特殊字符，英文的大小写字母

这样做的最大好处是，我只需要记住 2 的种子，即便暴露了 4 的规则，也不担心密码会被反向破译。

阅读全文 »

sharingan 自定义 CSS 特效

发表于 2019-03-24 分类于 R 技巧

sharingan 是非常优秀的幻灯片演示工具，作为一款网页工具，它本身也支持各种 CSS 的特效，这里罗列几种 CSS 特效，供读者参考。（本篇博客基本照抄团队杜亚磊的原创，我只是知识的搬运工，笑）

放大图片的特效

我们在使用写轮眼些幻灯片时，会遇到展示庞大网络图或者架构图，比如全力的游戏的人物图谱

可以想象，当使用幻灯片呈现这些关系图时，是很难比较清楚的将细节展示给观众的。如果我们能够使用 zoom in 的方式放大图片，那就完美了。这里给到了一种使用 jquery-zoom.js 来实现的机制。

阅读全文 »

数据科学的关键事件

发表于 2018-11-18 分类于数据思维

十月份在公司的技术中心分享了《数据思维、技术到商业价值》，从数据科学的重要基石之一统计学开讲，帮大家串了一下数据科学到底是什么东西。其中有一页幻灯片，讲到我心目中数据科学 milestone 的时间轴，这里分享给大家，以及怎么使用 R 包绘制。啥也不说，先看图：

阅读全文 »

贝叶斯个性化排序

发表于 2018-07-03 分类于算法

Bayesian Personalized Ranking 是基于隐式反馈数据的非常通用的个性化模型，一般实现使用的是 matrix factorization 机制，利用随机梯度下降来求解。

假设用来表达训练集的三元组为 \((u,i,j)\)，只需要找到“最优化”的用户的 f 维向量表征 \(w_{uf}\)，positive item i 的 f 维向量表征 \(h_{if}\)，negative item j 的 f 维向量表征 \(h_{jf}\)，则建模完毕。

它有以下几点优势：

不关注于拟合的具体数值损失最小，而是关注于 item 的排序关系
由于特殊的负采样策略，导致它的结果相对偏 High-Precision & Low-Recall
因为是潜变量模型，预测只是向量的相乘，工程化性能优异

阅读全文 »