Stata|如何处理中文乱码
2018-11-19 本文已影响5人
5a41eb2ceec6
注:版本 stata15.0
最近在研究CGSS数据库,发现把dta文件导入后,Data Editor里显示一堆乱码,于是Google一通,在 Stata 14 新功能:支持Unicode,这下变量名也可以是中文了 里找到答案,并显示正常~
代码为:
clear
cd "工作目录"
unicode analyze "文件名"
unicode encoding set "gbk"
unicode translate 文件名,invalid(ignore)
注意:转码前,Stata中不能有数据,得用clear清空内存
以在桌面的cgss2013_12.dta(C:\Users\Administrator\Desktop\cgss2015_12.dta) 为例
转码前

进行转码
clear
cd C:\Users\Administrator\Desktop
unicode analyze cgss2013_12.dta
unicode encoding set "gbk"
unicode translate cgss2013_12.dta,invalid(ignore)
转码后
