字串的问题
2017-03-15 本文已影响1人
sunlin1234
今天对一个字串进行遍历并拆分的时候,没有注意到汉字的问题,
汉字是一个汉字由两个字符构成的,[x for x in L] 这种情况的可以将单个的词拆开,但是会把一个汉字拆为两个字符,而造成的无法识别的情况。此时,可以使用Unicode来转换,Unicode(L)就可以。
今天对一个字串进行遍历并拆分的时候,没有注意到汉字的问题,
汉字是一个汉字由两个字符构成的,[x for x in L] 这种情况的可以将单个的词拆开,但是会把一个汉字拆为两个字符,而造成的无法识别的情况。此时,可以使用Unicode来转换,Unicode(L)就可以。