结巴分词例子
import jieba
结巴分词
sent = '当地时间9月26日,针对美方在联合国安理会声称中国正在干预美国的选举,国务委员兼外长王毅当场表示,中国历来坚持不干涉内政原则,这是中国的外交传统,也得到国际社会的普遍赞誉。'
全模式
wordlist = jieba.cut(sent,cut_all=True)
print(" | ".join(wordlist))
运行结果:
当地 | 时间 | 9 | 月 | 26 | 日 | | | 针对 | 美方 | 在 | 联合 | 联合国 | 联合国安理会 | 国安 | 安理会 | 理会 | 声称 | 中国 | 正在 | 干预 | 美国 | 的 | 选举 | | | 国务 | 国务委员 | 委员 | 兼 | 外长 | 王 | 毅 | 当场 | 表示 | | | 中国 | 国历 | 历来 | 坚持 | 不 | 干涉 | 干涉内政 | 内政 | 原则 | | | 这 | 是 | 中国 | 的 | 外交 | 传统 | | | 也 | 得到 | 国际 | 社会 | 的 | 普遍 | 赞誉 | |
精确模式
wordlist = jieba.cut(sent)
print(" | ".join(wordlist))
运行结果:
当地 | 时间 | 9 | 月 | 26 | 日 | , | 针对 | 美方 | 在 | 联合国安理会 | 声称 | 中国 | 正在 | 干预 | 美国 | 的 | 选举 | , | 国务委员 | 兼 | 外长 | 王毅 | 当场 | 表示 | , | 中国 | 历来 | 坚持 | 不 | 干涉内政 | 原则 | , | 这是 | 中国 | 的 | 外交 | 传统 | , | 也 | 得到 | 国际 | 社会 | 的 | 普遍 | 赞誉 | 。
搜索模式
wordlist = jieba.cut_for_search(sent)
print(" | ".join(wordlist))
运行结果:
当地 | 时间 | 9 | 月 | 26 | 日 | , | 针对 | 美方 | 在 | 联合 | 国安 | 理会 | 联合国 | 安理会 | 联合国安理会 | 声称 | 中国 | 正在 | 干预 | 美国 | 的 | 选举 | , | 国务 | 委员 | 国务委员 | 兼 | 外长 | 王毅 | 当场 | 表示 | , | 中国 | 历来 | 坚持 | 不 | 干涉 | 内政 | 干涉内政 | 原则 | , | 这是 | 中国 | 的 | 外交 | 传统 | , | 也 | 得到 | 国际 | 社会 | 的 | 普遍 | 赞誉 | 。