数据分析2-pandas数据处理基本操作
一、基础知识:
1)数据格式csv,一般第一行都会写上备注说明数据归属和来源,excel打开数据如下。
2)不用程序查看数据的情况下,excel会对数据处理,看不到数据原貌,所以查看数据的时候最好用文本编辑器打开数据,windows下用notepad++即可。
二、pycharm导入数据:
1.我们打开pycharm读取数据,按照路径导入数据,报错,提示为:SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 0-1: truncated \UXXXXXXXX escape
代码 错误码原因分析:引起这个错误的原因就是转义的问题
在windows系统当中读取文件路径可以使用\,但是在python字符串中\有转义的含义,如\t可代表TAB,\n代表换行,所以我们需要采取一些方式使得\不被解读为转义字符。
解决方案为:1)在路径前面加r,即保持字符原始值的意思。
pd.read_csv(r'C:\Users\Kevin\Desktop\demo\data\class5\BITFINEX_BTCUSD_20180124_1T.csv',)
2) 替换为双反斜杠,第一个反斜杠换为双反斜杠即可
pd.read_csv('\\Users\Kevin\Desktop\demo\data\class5\BITFINEX_BTCUSD_20180124_1T.csv',)
3) 替换为正斜杠
df= pd.read_csv('c:/Users/Kevin/Desktop/demo/data/class5/BITFINEX_BTCUSD_20180124_1T.csv',)
————————————————
以上三种方法经测试都是可以导入数据的,解决问题的思路来源于CSDN博主「可乐饲养员」的原创文章,感谢可乐饲养员,感谢互联网。(原文链接:https://blog.csdn.net/xd060606/article/details/87164798)
2.数据导入成功:
dataframe格式说明:
dataframe格式说明第二课筛选数据的基本操作练习完成