Python 入门(一) —— 数据结构
最近涉及到一些大模型相关的工作,因此也涉及到
Python
这个语言。而Python
不论作为脚本语言,还是在人工智能时代的应用,都有十分重要的地位和学习价值。因此,我会整理几篇文章来介绍一下Python
。
准备工作
学习 Python 之前,我建议可以安装下 PyCharm
这个软件。
同时,如果是用的 Mac,应该系统默认自带安装了 python3,因此无需特殊准备环境。
同时,Python
与其他语言最大的区别就是,Python
的代码块不使用大括号 {}
来控制类,函数以及其他逻辑判断。而是用缩进来写模块。(因此,写 py 代码如果没有编辑器/插件辅助,得用尺子量了,开个玩笑..)
例如:
if True:
print("647")
else:
print("false")
下面,我们来介绍下 Python
几个重要的数据结构:数组、元组、字典。
一、数组
1.1 简单使用
- 简单遍历:
arr = [6,4,7]
list = []
for n in arr:
if n % 2 == 0: # 找偶数
list.append(n)
print(list) # [6,4]
- 截取
arr = [6, 4, 7]
# 提取第 1 个元素
print(arr[0]) # 6
# 提取倒数第 2 个元素
print(arr[-2]) # 4
# 提取第一个后面所有的元素
print(arr[1:]) # [4, 7]
1.2 数组函数
- len(list):返回数组长度。
- max(list):返回数组里最大的元素。
- min(list):返回数组里最小的元素。
- list(tup):将元组转成数组。(下面会介绍元组)
举例:
arr = [6, 4, 7]
tup = (1,2)
print(len(arr)) # 3
print(max(arr)) # 7
print(min(arr)) # 4
print(list(tup)) #[1,2]
1.3 数组方法
- list.append(obj):在数组末尾追加新的元素。
- list.count(obj):统计某个元素在数组中出现的次数。
- list.extend(seq):在列表末尾一次性追加另一个数组。
- list.index(obj):找到数组中这个元素的第一个索引。
- list.insert(index,obj):在指定位置插入某个元素。
- list.pop([index=-1]):移除数组中的最后一个元素,并返回该值。
- list.remove(obj):移除数组中第一个匹配某个值的的元素。
- list.reverrse():数组反转。
- list.sort(key=None, reverse=False):对原列表排序。
举例:
list = [6, 4, 7]
list.append(6) # 在数组末尾追加新的元素。
print(list) # [6, 4, 7, 6]
print(list.count(6)) #统计某个元素在数组中出现的次数。
list.extend([4,7]) #在列表末尾一次性追加另一个数组。
print(list) # [6, 4, 7, 6, 4, 7]
print(list.index(4)) #找到数组中这个元素的第一个索引。
list.insert(0,5) #在指定位置插入某个元素。
print(list) # [5, 6, 4, 7, 6, 4, 7]
print(list.pop(0)) #移除数组中的最后一个元素,并返回该值。
print(list) # [6, 4, 7, 6, 4, 7]
list.remove(7) #移除数组中第一个匹配某个值的的元素。
print(list) # [6, 4, 6, 4, 7]
list.reverse() #数组反转。
print(list) # [7, 4, 6, 4, 6]
list.sort(key=None, reverse=False) #对原列表排序。
print(list) # [4, 4, 6, 6, 7]
1.4 列表推导
arr = [6,4,7]
list = [n for n in arr if n % 2 == 0]
print(list) # [6,4]
for in 也可以写多次,比如我们循环两次就会得到一个笛卡尔积。
signs = ['+', '-', 'x']
numbers = [6, 4, 7]
ascli = ['{s}{n}'.format(s=sign, n=number)
for sign in signs for number in numbers]
print(ascli) # ['+6', '+4', '+7', '-6', '-4', '-7', 'x6', 'x4', 'x7']
1.5 数组切片
arr[{start_index}: {end_index}, {step}],第一个代表开始的索引,第二个代表结束的索引,step 代表步长。如果不指定step,默认是 1。注意这里的区间是 [start, end),也就是左闭右开。
比如:
slice = 'hello,world'
print(slice[0:3:2]) # hl,表示从第 0 个到第 3 个[0,3) 且步长为 2。
s[0:5] # 不写 step 默认就是 1,因此得到 'hello'
s[1:] # 不写 end 默认到结尾,因此还是得到 'ello,world'
s[n:] # 获取 s 的最后 len(s) - n 个元素
s[:2] # 不写 start 默认从 0 开始,因此得到 'he'
s[:n] # 获取 s 的前 n 个元素
s[:-1] # 负数表示倒过来数,因此这会刨除最后一个字符,得到 'hello,worl'
s[-2:] # 同上,表示获取最后两个字符,得到 'ld'
s[::-1] # 获取字符串的倒序排列,相当于 reverse 函数
二、元组(tup)
元组可以理解成不可变的数组,没有 append
、del
等方法,一旦创建无法新增或删除元素。但元素内部(比如元组里有个数组,这个数组是可以变的)。
2.1 简单使用
举个例子:
tup = (1, [6, 4])
tup[0] = 2 # TypeError: 'tuple' object does not support item assignment
tup[1].append(7)
print(tup) # (1,[6, 4, 7])
一些小技巧:
- 两个元组是可以相加的。
tup = (6, ) + (4, 7)
print(tup) # (6, 4, 7)
- 元组本身也是可以做乘法的。
tup = (6, 4, 7) * 3
print(tup) # (6, 4, 7, 6, 4, 7, 6, 4, 7)
- 快速解析元组:
tup = (6, 4, 7)
a, b, _ = (6, 4, 7)
print(a, b) # 6 4
如果元组比较长,也可以这么写:
tup = (6, 4, 7, 6, 4, 7)
first, *middle, last = tup
print(first) # 6
print(middle) # [4, 7, 6, 4]
print(last) # 7
- 具名元组:像一个简化版的类,不能定义方法,但能提供友好的数据展示。
people = collections.namedtuple('people', ['name', 'age'])
p = people('647', '26')
print(p.name) # 647
2.2 元组函数
- len(tuple):返回元组元素个数。
- max(tuple):返回元组中所有元素的最大值。
- min(tuple):返回元组中所有元素的最小值。
- tuple(seq):把数组转成元组。
tup = (6, 4, 7)
print(len(tup))# 3
print(max(tup))# 7
print(min(tup))# 4
list = [6, 4, 7]
print(tuple(list))# (6, 4, 7)
三、字典(Dictionary)
3.1 简单使用
最简单的创建一个字典的方式就是使用字面量:
d = {'a': 6, 'b': 4, 'c': 7}
print(d['a'], d['b'], d['c']) # 6 4 7
遍历字典:
d = {'a': 6, 'b': 4, 'c': 7}
for i in d:
print(i, d[i])
3.2 字典函数:
-
dict.clear():删除字典内所有元素
-
dict.copy():浅拷贝出一个字典
-
dict.set(key, default=None):如果键不存在,则会添加键并将值设置为 default。
-
dict.get(key, default=None):返回指定 key 的键值。如果不存在则返回 default 值。
-
dict.has_key(key):判断字典里有无这个 key。
-
dict.items():以列表返回可遍历的元组。
-
dict.keys():以列表返回一个字典里的所有键。
-
dict.values():以列表返回一个字典里的所有值。
-
dict.update(dict2):把字典 dict2 的键值更新到 dict。
-
pop(key):删除字典 key 所对应的值,返回被删除的值。
-
popitem():删除字典中最后一对键值。