Stata|如何处理中文乱码

2018-11-19 本文已影响5人 5a41eb2ceec6

注：版本 stata15.0
最近在研究CGSS数据库，发现把dta文件导入后，Data Editor里显示一堆乱码，于是Google一通，在 Stata 14 新功能：支持Unicode，这下变量名也可以是中文了里找到答案，并显示正常~

代码为：
clear
cd "工作目录"
unicode analyze "文件名"
unicode encoding set "gbk"
unicode translate 文件名,invalid(ignore)

注意：转码前，Stata中不能有数据，得用clear清空内存

以在桌面的cgss2013_12.dta(C:\Users\Administrator\Desktop\cgss2015_12.dta) 为例

转码前

未转码

进行转码

clear
cd C:\Users\Administrator\Desktop
unicode analyze cgss2013_12.dta
unicode encoding set "gbk"
unicode translate cgss2013_12.dta,invalid(ignore)

转码后

转码后