jieba 分词基本使用

2018-03-19  本文已影响0人  chliar
    # 用法:jieba.load_userdict(file_name)        # file_name 为自定义··词典··的路径。
    # 词典格式和dict.txt一样,一个词占一行;每一行分三部分,一部分为词语,另一部分为词频(可省略),最后为词性(可省略),用空格隔开。
    # 词频可省略,使用计算出的能保证分出该词的词频。
    # 更改分词器的 tmp_dir 和 cache_file 属性,可指定缓存文件位置,用于受限的文件系统。
上一篇下一篇

猜你喜欢

热点阅读