2019-01-27

2019-02-13 本文已影响0人 hannah1123

:1 数据类型与数据变量

列表

元组

字典

集合

字符串的基本使用

两种注释

字符串相关的函数

re的使用

Python文件的读写与utf-8 与 unicode

1 数据类型：整数，浮点数，字符串，布尔，空值None (区别0是有意义的) ，变量，常量

Python还允许用r''表示''内部的字符串默认不转义： print(r'\\\t\\') ---->\\\t\\

Python允许用'''...'''的格式表示多行内容： print('''line1... line2... line3''') ---->line1

line2

line3

如图：

Python的整数没有大小限制，而某些语言的整数根据其存储长度是有大小限制的，例如Java对32位整数的范围限制在-2147483648-2147483647。Python的浮点数也没有大小限制，但是超出一定范围就直接表示为inf（无限大）

Python支持多种数据类型，在计算机内部，可以把任何数据都看成一个“对象”，而变量就是在程序中用来指向这些数据对象的，对变量赋值就是把数据和变量给关联起来。

除法：精确除（/）和地板除(//(向下取整)）

变量：

1 定义：变量的概念基本上和初中代数的方程变量是一致的，只是在计算机程序中，变量不仅可以是数字，还可以是任意数据类型；变量在程序中就是用一个变量名表示了，变量名必须是大小写英文、数字和_的组合，且不能用数字开头；

2 a 动态变量

eg : a ='ABC'

Python解释器干了两件事情：

在内存中创建了一个'ABC'的字符串；

在内存中创建了一个名为a的变量，并把它指向'ABC'

b 静态变量（在定义变量时必须指定变量类型，如果赋值的时候类型不匹配，就会报错。例如Java是静态语言

eg: int a =123;// a是整数类型变量

a ="ABC";// 错误：不能把字符串赋给整型变量）

2 字符编码

ASCII、Unicode和UTF-8的关系

Unicode应运而生。Unicode把所有语言都统一到一套编码里，这样就不会再有乱码问题了

如果统一成Unicode编码，乱码问题从此消失了。但是，如果你写的文本基本上全部是英文的话，用Unicode编码比ASCII编码需要多一倍的存储空间，在存储和传输上就十分不划算。

所以，本着节约的精神，又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间

UTF-8编码有一个额外的好处，就是ASCII编码实际上可以被看成是UTF-8编码的一部分，所以，大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。

总结

现在计算机系统通用的字符编码工作方式：（只有在内存中用Unicode编码）

在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。

用记事本编辑的时候，从文件读取的UTF-8字符被转换为Unicode字符到内存里，编辑完成后，保存的时候再把Unicode转换为UTF-8保存到文件

3 字符串

在最新的Python 3版本中，字符串是以Unicode编码的，也就是说，Python的字符串支持多语言

字符串的相关函数操作

4 两种注释

单行注释：

采用 # 开头

多行注释：

使用三个单引号(''')或三个双引号(""")

5 re 使用

6 python文件读写

7 集合列表字典元组

列表

元组

集合

字典

参考：

https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000

上一篇下一篇

猜你喜欢

热点阅读