在电脑里发现了一个叫pinyin-database.db的文件

2018-07-02  本文已影响34人  AlephAlpha

继续搬运果壳网的旧帖。原帖发表于2013-12-20。我已忘了当时用的是什么输入法,可能是 ibus-pinyin。


在电脑里发现了一个叫pinyin-database.db的文件。好像是拼音输入法的数据库。打开一看,里边的数据从1个字到14个字的词语的拼音和词频。不知道它的词频是从哪里统计来的,不过很有可能从网络上统计的,反正跟我的输入习惯没什么关系。

下面是不同字数的词频最高的十个词语,还挺好玩的:

不过我暂时还没想到能拿这些数据干什么好玩的事情。

另外,可以透露一下,另一个文件里保存着我自己的输入词频的数据库,里边最长的一个词是“挖个坑站进去假装自己是根胡萝卜”。


以下是卅猫的评论:

我喜欢你的时候,有一种爱叫做放手;
全心全意为人民服务,别说我的眼泪你无所谓;
明察秋毫之末而不见舆薪,舍得一身剐敢把皇帝拉下马。

造句大赛正式开始:
一有人在,他不是我的了。
所有论坛首页用户联系我们中心,关于注册 信息。
为什么现在的俱乐部计算机 自己的用户名上一页发表的,下一页的位置……
(下面的不加成分还能编吗)

上一篇 下一篇

猜你喜欢

热点阅读