欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python——字符串

程序员文章站 2022-03-30 12:17:45
一、基本字符串操作 所有标准的序列操作(索引、分片、乘法、判断成员资格、求长度、取最小值和最大值)对字符串同样适用。但是,...

一、基本字符串操作

所有标准的序列操作(索引、分片、乘法、判断成员资格、求长度、取最小值和最大值)对字符串同样适用。但是,请记住字符串都是不可变的。

二、字符串格式化:精简版

字符串格式化使用字符串格式化操作符即百分号%来实现。在%的左侧放置一个字符串(格式化字符串),而右侧则放置希望格式化的值。可以使用一个值,如一个字符串或者数字,也可以使用多个值的元组或者字典。

>>> format = "hello. %s. %s enough for ya?"
>>> values = ('world', 'hot')
>>> print(format % values)
hello. world. hot enough for ya?
注意:如果使用类表或者其他序列代替元组,那么序列就会被解释为一个值。只有元组和字典可以格式化一个以上的值。

格式化字符串的 %s 部分称为转换说明符(conversion specifier),它们标记了需要插入转换值的位置。

三、字符串格式化:完整版

1. 如果右操作数是元组的话,则其中的每一个元素都会被单独格式化,每个值都需要一个对应的转换说明符。

2. 基本的转换说明符包括以下部分。

(1)%字符:标记转换说明符的开始。

(2)转换标志(可选):- 表示左对齐;+ 表示在转换值之前要加上正负号;“ ”(空白字符)表示正数之前保留空格;0表示转换值若位数不够则用 0 填充。

(3)最小字段宽度(可选):转换后的字符串至少应该具有该值指定的宽度。如果是 *,则宽度会从值元组中读出。

(4)点(.)后跟精度值(可选):如果转换的是实数,精度值表示出现在小数点后的位数。如果转换的是字符串,那么该数字就表示最大字段宽度。如果是*,那么精度就会从元组中读出。

(5)转换类型

3.1 简单转换

简单的转换只需要写出转换类型。

>>> print(format % values)
hello. world. hot enough for ya?
>>> 'price of eggs: $%d' % 42
'price of eggs: $42'
>>> 'hexadecimal price of eggs: %x' % 42
'hexadecimal price of eggs: 2a'
3.2 字段宽度和精度

字段宽度是转换后的值所保留的最小字符个数,精度(对于数字转换来说)则是结果中应该包含的小数位数,或者(对于字符串转换来说)是转换后的值所能包含的最大字符个数。

这两个参数都是整数(首先是字段宽度,然后是精度),通过点号(.)分隔。虽然两个都是可选的参数,但如果只给出精度,就必须包含点号。

>>> from math import pi
>>> '%10f' % pi
'  3.141593'
>>> '%10.2f' % pi
'      3.14'
>>> '%.2f' % pi
'3.14'
>>> '%.*s' % (5, 'guido van rossum')
'guido'
3.3 符号、对齐和 0 填充

在字段宽度和精度值之前还可以放置一个“标表”,该标表可以是零、加号、减号或空格。零表示数字将会用 0 进行填充。

>>> '%010.2f' % pi
'0000003.14'
减号(-)用来做对齐数值:

>>> '%-10.2f' % pi
'3.14      '

空白(“ ”)意味着在正数前加上空格。

>>> print(('% 5d' % 10) + '\n' + ('% 5d' % -10))
   10
  -10

加号(+),它表示不管是正数还是负数都标示出符号。

>>> print(('%+5d' % 10) + '\n' + ('%+5d' % -10))
  +10
  -10
四、字符串方法

字符串的方法丰富得多,这是因为字符串从 string 模块中“继承”了很多方法。尽管字符串方法完全来源于 string 模块,但是这个模块还包括一些不能作为字符串方法使用的常量和函数。下面是一些有用的字符串常量。

(1) string.digits:包换数字 0 - 9 的字符串

(2) string.letters:包含所有字母(大写和小写)的字符串

(3) string.lowercase:包含所有小写字母的字符串

(4) string.printable:包含所有可打印字符的字符串

(5) string.punctuation:包含所有标点的字符串

(6) string.uppercase:包含所有大写字母的字符串

1. find

find 方法可以在一个较长的字符串中查找子字符串。它返回子串所在位置的最左端索引。如果没有找到则返回 -1。

>>> 'with no moo-moo here, and a moo-moo there'.find('moo')
8
>>> title = "monty python"s flying circus"
>>> title.find('monty')
0
>>> title.find('python')
6
>>> title.find('zirquss')
-1
find 方法还可以接受可选的起始点和结束点参数:

>>> subject = '$$$ get rich now!!! $$$'
>>> subject.find('$$$')
0
>>> subject.find('$$$', 1)
20
>>> subject.find('!!!')
16
>>> subject.find('!!!', 0, 16)
-1
由起始和终止值指定的范围(第二和第三个参数)包含第一个索引,但不包含第二个索引。

2. join

join 方法用来在队列中添加元素。需要添加的队列元素都必须是字符串。

>>> seq = ['1', '2', '3', '4', '5']
>>> sep = '+'
>>> sep.join(seq)
'1+2+3+4+5'
>>> dirs = '', 'usr', 'bin', 'env'
>>> '/'.join(dirs)
'/usr/bin/env'

3. lower

lower 方法返回字符串的小写字母版。

>>> 'trondhe hammer dance'.lower()
'trondhe hammer dance'
和 lower 方法相关的是 title 方法,它会将字符串转换为标题——也就是所有单词的首字母大写,而其他字母小写。

>>> "that's all folks".title()
"that's all folks"

4. replace

replace 方法返回某字符串的所有匹配项均被替换之后得到的字符串。

>>> 'this is a test'.replace('is', 'eez')
'theez eez a test'

5. split

split 方法将字符串分割成序列。

>>> '1+2+3+4+5'.split('+')
['1', '2', '3', '4', '5']
>>> '/usr/bin/env'.split('/')
['', 'usr', 'bin', 'env']
>>> 'using the default'.split()
['using', 'the', 'default']
如果不提供任何分隔符,程序会把所有空格作为分隔符(空格、制表、换行等)。

6. strip

strip 方法返回去除两侧(不包括内部)空格的字符串。

>>> '         internal whitespace is kept        '.strip()
'internal whitespace is kept'
也可以指定需要去除的字符,将它们列为参数即可。

>>> '*** spam * for * everyone!!! ***'.strip(' *!')
'spam * for * everyone'
这个方法只会去除两侧的字符,所以字符串中的星号没有被去掉。