结巴分词例子

2018-09-27  本文已影响0人  㗊𨰻木㵘燚㙓㗊

import jieba

结巴分词

sent = '当地时间9月26日,针对美方在联合国安理会声称中国正在干预美国的选举,国务委员兼外长王毅当场表示,中国历来坚持不干涉内政原则,这是中国的外交传统,也得到国际社会的普遍赞誉。'

全模式

wordlist = jieba.cut(sent,cut_all=True)
print(" | ".join(wordlist))

运行结果:
当地 | 时间 | 9 | 月 | 26 | 日 | | | 针对 | 美方 | 在 | 联合 | 联合国 | 联合国安理会 | 国安 | 安理会 | 理会 | 声称 | 中国 | 正在 | 干预 | 美国 | 的 | 选举 | | | 国务 | 国务委员 | 委员 | 兼 | 外长 | 王 | 毅 | 当场 | 表示 | | | 中国 | 国历 | 历来 | 坚持 | 不 | 干涉 | 干涉内政 | 内政 | 原则 | | | 这 | 是 | 中国 | 的 | 外交 | 传统 | | | 也 | 得到 | 国际 | 社会 | 的 | 普遍 | 赞誉 | |

精确模式

wordlist = jieba.cut(sent)
print(" | ".join(wordlist))
运行结果:
当地 | 时间 | 9 | 月 | 26 | 日 | , | 针对 | 美方 | 在 | 联合国安理会 | 声称 | 中国 | 正在 | 干预 | 美国 | 的 | 选举 | , | 国务委员 | 兼 | 外长 | 王毅 | 当场 | 表示 | , | 中国 | 历来 | 坚持 | 不 | 干涉内政 | 原则 | , | 这是 | 中国 | 的 | 外交 | 传统 | , | 也 | 得到 | 国际 | 社会 | 的 | 普遍 | 赞誉 | 。

搜索模式

wordlist = jieba.cut_for_search(sent)
print(" | ".join(wordlist))
运行结果:
当地 | 时间 | 9 | 月 | 26 | 日 | , | 针对 | 美方 | 在 | 联合 | 国安 | 理会 | 联合国 | 安理会 | 联合国安理会 | 声称 | 中国 | 正在 | 干预 | 美国 | 的 | 选举 | , | 国务 | 委员 | 国务委员 | 兼 | 外长 | 王毅 | 当场 | 表示 | , | 中国 | 历来 | 坚持 | 不 | 干涉 | 内政 | 干涉内政 | 原则 | , | 这是 | 中国 | 的 | 外交 | 传统 | , | 也 | 得到 | 国际 | 社会 | 的 | 普遍 | 赞誉 | 。

上一篇下一篇

猜你喜欢

热点阅读