Python——字符串
一、基本字符串操作
所有标准的序列操作(索引、分片、乘法、判断成员资格、求长度、取最小值和最大值)对字符串同样适用。但是,请记住字符串都是不可变的。
二、字符串格式化:精简版
字符串格式化使用字符串格式化操作符即百分号%来实现。在%的左侧放置一个字符串(格式化字符串),而右侧则放置希望格式化的值。可以使用一个值,如一个字符串或者数字,也可以使用多个值的元组或者字典。
>>> format = "hello. %s. %s enough for ya?" >>> values = ('world', 'hot') >>> print(format % values) hello. world. hot enough for ya?注意:如果使用类表或者其他序列代替元组,那么序列就会被解释为一个值。只有元组和字典可以格式化一个以上的值。
格式化字符串的 %s 部分称为转换说明符(conversion specifier),它们标记了需要插入转换值的位置。
三、字符串格式化:完整版
1. 如果右操作数是元组的话,则其中的每一个元素都会被单独格式化,每个值都需要一个对应的转换说明符。
2. 基本的转换说明符包括以下部分。
(1)%字符:标记转换说明符的开始。
(2)转换标志(可选):- 表示左对齐;+ 表示在转换值之前要加上正负号;“ ”(空白字符)表示正数之前保留空格;0表示转换值若位数不够则用 0 填充。
(3)最小字段宽度(可选):转换后的字符串至少应该具有该值指定的宽度。如果是 *,则宽度会从值元组中读出。
(4)点(.)后跟精度值(可选):如果转换的是实数,精度值表示出现在小数点后的位数。如果转换的是字符串,那么该数字就表示最大字段宽度。如果是*,那么精度就会从元组中读出。
(5)转换类型
3.1 简单转换
简单的转换只需要写出转换类型。
>>> print(format % values) hello. world. hot enough for ya? >>> 'price of eggs: $%d' % 42 'price of eggs: $42' >>> 'hexadecimal price of eggs: %x' % 42 'hexadecimal price of eggs: 2a'3.2 字段宽度和精度
字段宽度是转换后的值所保留的最小字符个数,精度(对于数字转换来说)则是结果中应该包含的小数位数,或者(对于字符串转换来说)是转换后的值所能包含的最大字符个数。
这两个参数都是整数(首先是字段宽度,然后是精度),通过点号(.)分隔。虽然两个都是可选的参数,但如果只给出精度,就必须包含点号。
>>> from math import pi >>> '%10f' % pi ' 3.141593' >>> '%10.2f' % pi ' 3.14' >>> '%.2f' % pi '3.14' >>> '%.*s' % (5, 'guido van rossum') 'guido'3.3 符号、对齐和 0 填充
在字段宽度和精度值之前还可以放置一个“标表”,该标表可以是零、加号、减号或空格。零表示数字将会用 0 进行填充。
>>> '%010.2f' % pi '0000003.14'减号(-)用来做对齐数值:
>>> '%-10.2f' % pi '3.14 '
空白(“ ”)意味着在正数前加上空格。
>>> print(('% 5d' % 10) + '\n' + ('% 5d' % -10)) 10 -10
加号(+),它表示不管是正数还是负数都标示出符号。
>>> print(('%+5d' % 10) + '\n' + ('%+5d' % -10)) +10 -10四、字符串方法
字符串的方法丰富得多,这是因为字符串从 string 模块中“继承”了很多方法。尽管字符串方法完全来源于 string 模块,但是这个模块还包括一些不能作为字符串方法使用的常量和函数。下面是一些有用的字符串常量。
(1) string.digits:包换数字 0 - 9 的字符串
(2) string.letters:包含所有字母(大写和小写)的字符串
(3) string.lowercase:包含所有小写字母的字符串
(4) string.printable:包含所有可打印字符的字符串
(5) string.punctuation:包含所有标点的字符串
(6) string.uppercase:包含所有大写字母的字符串
1. find
find 方法可以在一个较长的字符串中查找子字符串。它返回子串所在位置的最左端索引。如果没有找到则返回 -1。
>>> 'with no moo-moo here, and a moo-moo there'.find('moo') 8 >>> title = "monty python"s flying circus" >>> title.find('monty') 0 >>> title.find('python') 6 >>> title.find('zirquss') -1find 方法还可以接受可选的起始点和结束点参数:
>>> subject = '$$$ get rich now!!! $$$' >>> subject.find('$$$') 0 >>> subject.find('$$$', 1) 20 >>> subject.find('!!!') 16 >>> subject.find('!!!', 0, 16) -1由起始和终止值指定的范围(第二和第三个参数)包含第一个索引,但不包含第二个索引。
2. join
join 方法用来在队列中添加元素。需要添加的队列元素都必须是字符串。
>>> seq = ['1', '2', '3', '4', '5'] >>> sep = '+' >>> sep.join(seq) '1+2+3+4+5' >>> dirs = '', 'usr', 'bin', 'env' >>> '/'.join(dirs) '/usr/bin/env'
3. lower
lower 方法返回字符串的小写字母版。
>>> 'trondhe hammer dance'.lower() 'trondhe hammer dance'和 lower 方法相关的是 title 方法,它会将字符串转换为标题——也就是所有单词的首字母大写,而其他字母小写。
>>> "that's all folks".title() "that's all folks"
4. replace
replace 方法返回某字符串的所有匹配项均被替换之后得到的字符串。
>>> 'this is a test'.replace('is', 'eez') 'theez eez a test'
5. split
split 方法将字符串分割成序列。
>>> '1+2+3+4+5'.split('+') ['1', '2', '3', '4', '5'] >>> '/usr/bin/env'.split('/') ['', 'usr', 'bin', 'env'] >>> 'using the default'.split() ['using', 'the', 'default']如果不提供任何分隔符,程序会把所有空格作为分隔符(空格、制表、换行等)。
6. strip
strip 方法返回去除两侧(不包括内部)空格的字符串。
>>> ' internal whitespace is kept '.strip() 'internal whitespace is kept'也可以指定需要去除的字符,将它们列为参数即可。
>>> '*** spam * for * everyone!!! ***'.strip(' *!') 'spam * for * everyone'这个方法只会去除两侧的字符,所以字符串中的星号没有被去掉。