序列类型-字符串操作

2018-11-09  本文已影响0人  风清云淡Python
序列类型共同的运算及函数.png

字符串是一个任意Unicode字符序列,包括中文等。可以用三种定界符:单引号、双引号、三引号,但是字符串的首末都得用一样的定界符,如:″ABout″,′123′。三引号用于表示跨行的字符串,如程序的跨行注释。
要访问字符串中单独的某个字符,用这个字符在字符串中的位置(索引),即这个字符离首字符的偏移量,注意首字符的位置为0,运算采用方括号[],方括号中表达式即为索引,也称为下标。字符串的索引有两种方式:一种是从0开始,向右依次递增序号,另一种是从-1开始,向左依次递减序号,如图1所示。因此访问字符′A′的可用反向递减的索引方式:ft[-5]


字符串索引方式

如果要访问字符串中的一个子串,则可以采用区间访问的方式,也可称为分片操作:[M:N],其中M和N为字符串的索引号,表示从M到N(不包括N)的子串,可以采用混合的索引方式,即一个使用递增的索引顺序,另一个采用递减的索引顺序。如果缺省M或N,则分别默认为字符串的开始或结尾的索引号。
字符串(str)是一个类,封装了一系列的方法来处理更为复杂的文本处理任务的函数,这些封装在类中的函数称为方法,所以说方法就是和特定对象相关联的函数。对于方法的调用方式是:a.b(),表示调用对象a的方法b()。每个字符串均是一个对象,表2列出了部分常用的字符串方法。


字符串方法

*注:字符串可以有列表的下标访问str[0],以及切片str[1:3]、反转str[::-1]

字符串的拼接

Python使用+来合并两个字符串,这种合并字符串的方法叫做拼接。其基本语法如下:

result_string = source_string1 + source_string2

其中,

# coding=utf-8
# 将姓氏和名字分别保存在两个变量中
first_name = 'Zhang'
last_name = 'san'
# 将姓氏和名字拼接,将结果存储在full_name变量中
full_name = first_name + " " + last_name
print(full_name)

输出结果: Zhang san

[字符串长度获取]、 [大小写转换]、[去除字符串首尾空格]

Python标准库提供了一系列关于字符串处理的函数。本关的小目标是让读者学习并掌握Python常用字符串方法中的len()lower()strip()函数的用法并完成相应字符串处理任务。

求字符串的长度

Python提供了len()函数来计算并返回字符串的长度,即字符串中单个元素的个数。其基本语法如下:

length = len(target_string)

大小写转换

Python提供了upper()lower()方法来对字符串进行大小写转换。其中,upper()会将字符串中的所有字符都转换为大写,lower()则将所有字符转换为小写。

除此之外,Python还贴心的提供了title()方法将字符串所有单词的首字母变成大写,而其他字母依然小写

# 将源字符串转换为大写并存入upper_string变量
upper_string = source_string.upper()
# 将源字符串转换为小写并存入lower_string变量
lower_string = source_string.lower()
# 将源字符串每个词首字母转换为大写并存入title_string变量
title_string = source_string.title()


去除字符串首尾空格

蟒了提供strip()方法,可以去除字符串两侧(不包含内部)全部的空格;使用该方法,也可以通过指定参数,去除两侧指定的特定字符

其基本语法如下:

strip_string1 = source_string.strip()
string_strip2 = source_string.strip(target_char)

其中,

# coding = utf-8
# 创建一个字符串hello_world
hello_world = '  **The world ** is big!*    '
# 利用strip()方法处理hello_world字符串
blank_hello_world = hello_world.strip()
char_hello_world = hello_world.strip('TH *')
# 打印输出转换后的字符串
print(blank_hello_world)
print(char_hello_world)

输出结果:
**The world ** is big!*
he world ** is big!
输出结果分析:

字符串查找

Python中提供了内置的字符串查找方法find(),利用该方法可以在一个较长的字符串中查找子字符串。如果该字符串中有一个或者多个子字符串,则该方法返回第一个子串所在位置的最左端索引;若没有找到符合条件的子串,则返回-1。
find()方法的基本使用语法如下:

source_string.find(sub_string)

其中,

# coding=utf-8
# 创建一个字符串
source_string = 'The past is gone and static'
# 查看"past"在source_string字符串中的位置
print(source_string.find('past'))
# 查看"love"在source_string字符串中的位置
print(source_string.find('love'))

输出结果:
4
-1

index()方法:

python 的index方法是在字符串里查找子串第一次出现的位置,类似字符串的find方法,不过比find方法更好的是,如果查找不到子串,会抛出异常,而不是返回-1

info = 'abca'
print info.index('a')
print info.index('33')

rfindrindex方法用法和上面一样,只是从字符串的末尾开始查找。

字符串替换

蟒蛇了提供replace()方法,用以替换给定字符串中的子串,其基本使用语法如下:

source_string.replace(old_string, new_string)

其中,

# coding = utf-8
# 创建一个字符串circle
source_string = 'The world is big'
# 利用replace()方法用子串"small"代替子串"big"
print(source_string.replace('big','small'))

输出结果:
The world is small

字符串分割

蟒了提供split()方法实现字符串分割。该方法根据提供的分隔符将一个字符串分割为字符列表,如果不提供分隔符则程序会默认把空格(制表,换行等)作为分隔符。其基本使用语法如下:

source_string.split(separator)

其中,

# coding = utf-8
# 待处理字符串source_string
source_string = '1+2+3+4+5'
# 利用split()方法,按照`+`和`/`对source_string字符串进行分割
print(source_string.split('+'))
print(source_string.split('/'))

输出结果:
['1', '2', '3', '4', '5']
['1+2+3+4+5']

count()方法

Python count()方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置。
语法
count()方法语法:

str.count(sub, start= 0,end=len(string))

参数

返回值
该方法返回子字符串在字符串中出现的次数。
实例
以下实例展示了count()方法的实例:

实例(Python 2.0+)
#!/usr/bin/python
 
str = "this is string example....wow!!!";
 
sub = "I";
print "str.count(sub, 4, 40) : ", str.count(sub, 4, 40)
sub = "wow";
print "str.count(sub) : ", str.count(sub)

以上实例输出结果如下:
str.count(sub, 4, 40) : 2
str.count(sub) : 1

上一篇 下一篇

猜你喜欢

热点阅读