分类

2019-01-30  本文已影响0人  dreampai

第 14 章:余弦定律和新闻分类

计算机根本读不懂新闻,计算机的本质上只能做快速计算。

计算向量余弦的技巧

image.png

第 15 章:矩阵运算和文本处理中两个分类问题

文本和词汇的矩阵

最常见的两个分类问题:

image.png

在实际应用中,可以先进行奇异值分解,得到粗分类结果,再利用计算向量余弦的方法,在粗分类结果的基础上,进行几次迭代,得到比较精确的结果。这样,这两个方法一先一后结合使用,可以充分利用两者的优势,既节省时间,又能获得很好的准确性。

第 20 章:最大熵模型

最大熵原理和最大熵模型

最大熵:要保留全部的不确定性,将风险降到最小。
最大熵原理指出:对一个随机事件的概率分布预测时,我们的预测应当满足全部已知的条件,而对未知的情况不要做任何主观假设。在这种情况下,概率分布均匀,预测的风险最小。因为这时概率分布的信息熵最大,“最大熵模型”。


image.png

第 21 章:拼音输入法的数学原理

个性化的语言模型

image.png
image.png

第 23 章:布隆过滤器

上一篇 下一篇

猜你喜欢

热点阅读