bert 字符编码报错

2020-03-03  本文已影响0人  Chris__W

报错信息: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcd in position 9: invalid continuation byte

三份数据文件:train.tsv dev.tsv test.tsv 不是utf-8编码导致,在notepad++中转换为utf-8即可

上一篇下一篇

猜你喜欢

热点阅读