Python 入门（一） —— 数据结构

2023-08-26 本文已影响0人齐舞647

最近涉及到一些大模型相关的工作，因此也涉及到 Python 这个语言。而 Python 不论作为脚本语言，还是在人工智能时代的应用，都有十分重要的地位和学习价值。因此，我会整理几篇文章来介绍一下 Python。

准备工作

学习 Python 之前，我建议可以安装下 PyCharm 这个软件。
同时，如果是用的 Mac，应该系统默认自带安装了 python3，因此无需特殊准备环境。

同时，Python 与其他语言最大的区别就是，Python 的代码块不使用大括号 {} 来控制类，函数以及其他逻辑判断。而是用缩进来写模块。（因此，写 py 代码如果没有编辑器/插件辅助，得用尺子量了，开个玩笑..）

例如：

if True:
    print("647")
else:
    print("false")

下面，我们来介绍下 Python 几个重要的数据结构：数组、元组、字典。

一、数组

1.1 简单使用

简单遍历：

arr = [6,4,7]
list = []

for n in arr:
    if n % 2 == 0: # 找偶数
        list.append(n)

print(list) # [6,4]

截取

arr = [6, 4, 7]

# 提取第 1 个元素
print(arr[0]) # 6
# 提取倒数第 2 个元素
print(arr[-2]) # 4
# 提取第一个后面所有的元素
print(arr[1:]) # [4, 7]

1.2 数组函数

len(list)：返回数组长度。
max(list)：返回数组里最大的元素。
min(list)：返回数组里最小的元素。
list(tup)：将元组转成数组。（下面会介绍元组）

举例：

arr = [6, 4, 7]
tup = (1,2)
print(len(arr)) # 3
print(max(arr)) # 7
print(min(arr)) # 4
print(list(tup)) #[1,2]

1.3 数组方法

list.append(obj)：在数组末尾追加新的元素。
list.count(obj)：统计某个元素在数组中出现的次数。
list.extend(seq)：在列表末尾一次性追加另一个数组。
list.index(obj)：找到数组中这个元素的第一个索引。
list.insert(index,obj)：在指定位置插入某个元素。
list.pop([index=-1])：移除数组中的最后一个元素，并返回该值。
list.remove(obj)：移除数组中第一个匹配某个值的的元素。
list.reverrse()：数组反转。
list.sort(key=None, reverse=False)：对原列表排序。

举例：

list = [6, 4, 7]
list.append(6) # 在数组末尾追加新的元素。
print(list) # [6, 4, 7, 6]
print(list.count(6)) #统计某个元素在数组中出现的次数。
list.extend([4,7]) #在列表末尾一次性追加另一个数组。
print(list) # [6, 4, 7, 6, 4, 7]
print(list.index(4)) #找到数组中这个元素的第一个索引。
list.insert(0,5) #在指定位置插入某个元素。
print(list) # [5, 6, 4, 7, 6, 4, 7]
print(list.pop(0)) #移除数组中的最后一个元素，并返回该值。
print(list) # [6, 4, 7, 6, 4, 7]
list.remove(7) #移除数组中第一个匹配某个值的的元素。
print(list) # [6, 4, 6, 4, 7]
list.reverse() #数组反转。
print(list) # [7, 4, 6, 4, 6]
list.sort(key=None, reverse=False) #对原列表排序。
print(list) # [4, 4, 6, 6, 7]

1.4 列表推导

arr = [6,4,7]
list = [n for n in arr if n % 2 == 0]
print(list) # [6,4]

for in 也可以写多次，比如我们循环两次就会得到一个笛卡尔积。

signs = ['+', '-', 'x']
numbers = [6, 4, 7]

ascli = ['{s}{n}'.format(s=sign, n=number)
         for sign in signs for number in numbers]
print(ascli) # ['+6', '+4', '+7', '-6', '-4', '-7', 'x6', 'x4', 'x7']

1.5 数组切片

arr[{start_index}: {end_index}, {step}]，第一个代表开始的索引，第二个代表结束的索引，step 代表步长。如果不指定step，默认是 1。注意这里的区间是 [start, end)，也就是左闭右开。

比如：

slice = 'hello,world'
print(slice[0:3:2]) # hl，表示从第 0 个到第 3 个[0,3) 且步长为 2。

s[0:5]  # 不写 step 默认就是 1，因此得到 'hello'
s[1:]   # 不写 end 默认到结尾，因此还是得到 'ello,world'
s[n:]   # 获取 s 的最后 len(s) - n 个元素
s[:2]   # 不写 start 默认从 0 开始，因此得到 'he'
s[:n]   # 获取 s 的前 n 个元素
s[:-1]  # 负数表示倒过来数，因此这会刨除最后一个字符，得到 'hello,worl'
s[-2:]  # 同上，表示获取最后两个字符，得到 'ld'
s[::-1] # 获取字符串的倒序排列，相当于 reverse 函数

二、元组（tup）

元组可以理解成不可变的数组，没有 append、del等方法，一旦创建无法新增或删除元素。但元素内部（比如元组里有个数组，这个数组是可以变的）。

2.1 简单使用

举个例子：

tup = (1, [6, 4])
tup[0] = 2 # TypeError: 'tuple' object does not support item assignment
tup[1].append(7)
print(tup) # (1,[6, 4, 7])

一些小技巧：

两个元组是可以相加的。

tup = (6, ) + (4, 7)
print(tup) # (6, 4, 7)

元组本身也是可以做乘法的。

tup = (6, 4, 7) * 3
print(tup) # (6, 4, 7, 6, 4, 7, 6, 4, 7)

快速解析元组：

tup = (6, 4, 7)
a, b, _ = (6, 4, 7)
print(a, b) # 6 4

如果元组比较长，也可以这么写：

tup = (6, 4, 7, 6, 4, 7)
first, *middle, last = tup
print(first) # 6
print(middle) # [4, 7, 6, 4]
print(last) # 7

具名元组：像一个简化版的类，不能定义方法，但能提供友好的数据展示。

people = collections.namedtuple('people', ['name', 'age'])
p = people('647', '26')
print(p.name) # 647

2.2 元组函数

len(tuple)：返回元组元素个数。
max(tuple)：返回元组中所有元素的最大值。
min(tuple)：返回元组中所有元素的最小值。
tuple(seq)：把数组转成元组。

tup = (6, 4, 7)
print(len(tup))# 3
print(max(tup))# 7
print(min(tup))# 4
list = [6, 4, 7]
print(tuple(list))# (6, 4, 7)

三、字典（Dictionary）

3.1 简单使用

最简单的创建一个字典的方式就是使用字面量：

d = {'a': 6, 'b': 4, 'c': 7}
print(d['a'], d['b'], d['c']) # 6 4 7

遍历字典：

d = {'a': 6, 'b': 4, 'c': 7}
for i in d:
    print(i, d[i])

3.2 字典函数：

dict.clear()：删除字典内所有元素
dict.copy()：浅拷贝出一个字典
dict.set(key, default=None)：如果键不存在，则会添加键并将值设置为 default。
dict.get(key, default=None)：返回指定 key 的键值。如果不存在则返回 default 值。
dict.has_key(key)：判断字典里有无这个 key。
dict.items()：以列表返回可遍历的元组。
dict.keys()：以列表返回一个字典里的所有键。
dict.values()：以列表返回一个字典里的所有值。
dict.update(dict2)：把字典 dict2 的键值更新到 dict。
pop(key)：删除字典 key 所对应的值，返回被删除的值。
popitem()：删除字典中最后一对键值。