一些NLP coding中的小知识(python)——持续更新

2019-03-06  本文已影响0人  双听
1. 读文件时,如果遇到了类似 "gbk’ codec can’t decode bytes in position 31023: illegal multibyte sequence" 这样的编码错误,有两个解决方法可以尝试:

方法一:用notepad++将文本编码转换为特定的方式,再用这种编码方式对文件进行读取:

方法二:在对文件进行open操作的时候,对引起编码错误的字符采取'ignore'处理,具体如下:

2. 有时候我们想查看的python第三方库的安装路径,可以通过以下方式查看:
上一篇 下一篇

猜你喜欢

热点阅读