python列表、数组和矩阵的逻辑切片
1 数据类型
写这篇文章的初衷是在我用矩阵的逻辑切片遇到问题了,然后上网找相关的文章,发现很多文章的作者根本没有搞懂这三种数据类型的区别,有的人坚持认为二维数组就是矩阵,标题都写错了,实在是不严谨。这里先科普一下这三个数据类型:
- 列表,翻译过来就是list,是python自带的数据类型,里边的数据类型可以是任意的、不相同的,你再里边嵌套另外一个list都可以。像这样,都是合法的:
list1 = [['a','b'],1,2,'a','b']
list不可以做数学运算的,如果两个list相加,其实就是把两个list拼接起来而已。
a = [1,2,3,4]
b = [2,3,4,5]
a+b
Out: [1, 2, 3, 4, 2, 3, 4, 5]
- 数组,翻译过来就是array,是python numpy里的数据类型,既然叫数组,肯定全部都是由数字组成的,这样的话就可以进行各种加减乘除操作了。array有一维、二维、三维、n维的,怎么区分呢,一般是有几个中括号就是几维。比如下面这个是二维数组:
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]
[12 13 14 15]]
-矩阵,翻译过来就是matrix,是python numpy里的数据类型,说实话这个数据类型有点鸡肋了,因为它能做的操作array都可以,只不过语法上有所区别,但是matrix又是最接近我们数学里现代学过的那个matrix所以短时间内不会被改变的,至于用不用,看你自己的需求吧。注意,这个很容易跟array混淆,比如乘法,逻辑切片等操作都不一样。下边就是一个矩阵,长得跟array一样,但是很多操作都不一样。
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]
[12 13 14 15]]
2 逻辑切片方法
知道列表、数组和矩阵是什么了,下面就讲讲逻辑切片的事,说这个之前我默认你对于他们的基本切片操作都了解了。至少知道不能拿一个列表去对列表进行切片,但是可以拿列表对array进行切片,如果你不知道我说的什么意思,自己去学一下基础知识。
- 列表的逻辑切片,列表切片很简单的就是三个数字拼一起,比如list1[1:4:1]代表从第2位到第5位每次按步长1取数,但不包括最后的第5位。更多操作自己探索,很简单的。
现在要解决的是列表可以不可以采用逻辑切片,下面来试验一下:
a = [1,2,3,4]
a[a==2]
out:
1
程序没报错,好像可以用逻辑切片,但是仔细一看应该输出2才对,为什么输出的是1啊,因为程序先判断a==2是不是成立,是按一个列表去判断的,返回的是False,False就是0,自然返回0下标对应的元素1。
接下来,自己输入一个逻辑列表进去看看是啥:
a = [1,2,3,4]
a[[True,False,False,False]]
TypeError: list indices must be integers or slices, not list
很遗憾报错了,因为之前也说了list不接受列表作为下标,用逻辑值切片自然也是不可实现的。
- 数组
数组的逻辑切片使用的是最顺手的,实际工程项目中逻辑切片也经常发生在数组上,这个思路比较简单,先看例子:
data = np.arange(16).reshape(4,4)
data = np.array(data)
data[data[:,2] == 6]
输出:
array([[4, 5, 6, 7]])
一切都没有问题,返回了满足条件的那一行,主要是因为data[:,2] == 6返回的事一维数组用于对应data这个二维数组哪一行该输出,很显然在数组里逻辑切片是简单好用的。
- 矩阵
既然数组里那么好用,那么矩阵是二维数组的特殊形式也应该可以用吧,我们来操作一下:
data = np.arange(16).reshape(4,4)
data = np.mat(data)
data[data[:,2] == 6]
输出:
IndexError: boolean index did not match indexed array along dimension 1; dimension is 4 but corresponding boolean dimension is 1
很遗憾,报错了,对于一些用矩阵编写的程序,难道逻辑切片就不可用了吗,别急肯定有解决方案,但得先知道原因,运行一下data[:,2] == 6,返回一个二维矩阵,用二维矩阵去做切片本身就是错的,因为通常只有一维数组才能做切片啊,好了 现在就是把二维矩阵转化成一维数组了,有两种思路:
思路1:
data = np.arange(16).reshape(4,4)
data = np.mat(data)
data[np.array(data)[:,2] == 6]
Out[99]: matrix([[4, 5, 6, 7]])
既然数组可用,那么我们直接用数组做切片就好了,得到最终结果是个矩阵,和上边数组的区别是数组得到的是array。
思路2:
data = np.arange(16).reshape(4,4)
data = np.mat(data)
data[(data_mat[:,2] == 6).flatten().tolist()]
Out[101]: matrix([[4, 5, 6, 7]])
也好用,主要是先把矩阵拉平再转化成list就可以做切片了
总结一下就是:
列表不能做逻辑切片的
数组是我们最常用做逻辑切片的
矩阵也能做逻辑切片不过得处理一下
一般我们采用数组做逻辑切片就好啦,如果有矩阵的应用场景,你数组做完再转回矩阵就可以了。