Python动态赋值的陷阱知识点总结

程序员文章站 2022-05-14 11:02:51

忘了在哪看到一位编程大牛调侃，他说程序员每天就做两件事，其中之一就是处理字符串。相信不少同学会有同感。几乎任何一种编程语言，都把字符串列为最基础和不可或缺的数据类型。而...

忘了在哪看到一位编程大牛调侃，他说程序员每天就做两件事，其中之一就是处理字符串。相信不少同学会有同感。

几乎任何一种编程语言，都把字符串列为最基础和不可或缺的数据类型。而拼接字符串是必备的一种技能。今天，我跟大家一起来学习python拼接字符串的七种方式。

1、来自c语言的%方式

print('%s %s' % ('hello', 'world'))
>>> hello world

%号格式化字符串的方式继承自古老的c语言，这在很多编程语言都有类似的实现。上例的%s是一个占位符，它仅代表一段字符串，并不是拼接的实际内容。实际的拼接内容在一个单独的%号后面，放在一个元组里。

类似的占位符还有：%d（代表一个整数）、%f（代表一个浮点数）、%x（代表一个16进制数），等等。%占位符既是这种拼接方式的特点，同时也是其限制，因为每种占位符都有特定意义，实际使用起来太麻烦了。

2、format()拼接方式

# 简洁版
s1 = 'hello {}! my name is {}.'.format('world', 'python猫')
print(s1)
>>>hello world! my name is python猫.

# 对号入座版
s2 = 'hello {0}! my name is {1}.'.format('world', 'python猫')
s3 = 'hello {name1}! my name is {name2}.'.format(name1='world', name2='python猫')
print(s2)
>>>hello world! my name is python猫.
print(s3)
>>>hello world! my name is python猫.

这种方式使用花括号{}做占位符，在format方法中再转入实际的拼接值。容易看出，它实际上是对%号拼接方式的改进。这种方式在python2.6中开始引入。

上例中，简洁版的花括号中无内容，缺点是容易弄错次序。对号入座版主要有两种，一种传入序列号，一种则使用key-value的方式。实战中，我们更推荐后一种，既不会数错次序，又更直观可读。

3、() 类似元组方式

s_tuple = ('hello', ' ', 'world')
s_like_tuple = ('hello' ' ' 'world')

print(s_tuple) 
>>>('hello', ' ', 'world')
print(s_like_tuple) 
>>>hello world

type(s_like_tuple) >>>str

注意，上例中s_like_tuple并不是一个元组，因为元素间没有逗号分隔符，这些元素间可以用空格间隔，也可以不要空格。使用type()查看，发现它就是一个str类型。我没查到这是啥原因，猜测或许()括号中的内容是被python优化处理了。

这种方式看起来很快捷，但是，括号()内要求元素是真实字符串，不能混用变量，所以不够灵活。

# 多元素时，不支持有变量
str_1 = 'hello'
str_2 = (str_1 'world')
>>> syntaxerror: invalid syntax
str_3 = (str_1 str_1)
>>> syntaxerror: invalid syntax
# 但是下面写法不会报错
str_4 = (str_1)

4、面向对象模板拼接

from string import template
s = template('${s1} ${s2}!') 
print(s.safe_substitute(s1='hello',s2='world')) 
>>> hello world!

说实话，我不喜欢这种实现方式。浓浓的一股被面向对象思想毒害的臭味。

就不多说了。

5、常用的+号方式

str_1 = 'hello world！ ' 
str_2 = 'my name is python猫.'
print(str_1 + str_2)
>>>hello world！ my name is python猫.
print(str_1)
>>>hello world！

这种方式最常用、直观、易懂，是入门级的实现方式。但是，它也存在两处让人容易犯错的地方。

首先，新入门编程的同学容易犯错，他们不知道字符串是不可变类型，新的字符串会独占一块新的内存，而原来的字符串保持不变。上例中，拼接前有两段字符串，拼接后实际有三段字符串。

其次，一些有经验的老程序员也容易犯错，他们以为当拼接次数不超过3时，使用+号连接符就会比其它方式快（ps：不少python教程都是如此建议），但这没有任何合理根据。

事实上，在拼接短的字面值时，由于cpython中的常数折叠（constant folding）功能，这些字面值会被转换成更短的形式，例如'a'+'b'+'c' 被转换成'abc'，'hello'+'world'也会被转换成'hello world'。这种转换是在编译期完成的，而到了运行期时就不会再发生任何拼接操作，因此会加快整体计算的速度。

常数折叠优化有一个限度，它要求拼接结果的长度不超过20。所以，当拼接的最终字符串长度不超过20时，+号操作符的方式，会比后面提到的join等方式快得多，这与+号的使用次数无关。

题外话：你是否觉得20这个数字很熟悉呢？没错，我们之前在《python中的“特权种族”是什么？》中提到过，字符串类的特权种族也是以20为限。当时也有一个例子，展示了编译期和运行期的区别，建议你去回看。

6、join()拼接方式

str_list = ['hello', 'world']
str_join1 = ' '.join(str_list)
str_join2 = '-'.join(str_list)
print(str_join1) >>>hello world
print(str_join2) >>>hello-world

str对象自带的join()方法，接受一个序列参数，可以实现拼接。拼接时，元素若不是字符串，需要先转换一下。可以看出，这种方法比较适用于连接序列对象中（例如列表）的元素，并设置统一的间隔符。

当拼接长度超过20时，这种方式基本上是首选。不过，它的缺点就是，不适合进行零散片段的、不处于序列集合的元素拼接。

7、f-string方式

name = 'world'
myname = 'python_cat'
words = f'hello {name}. my name is {myname}.'
print(words)
>>> hello world. my name is python_cat.

f-string方式出自pep 498（literal string interpolation，字面字符串插值），从python3.6版本引入。其特点是在字符串前加 f 标识，字符串中间则用花括号{}包裹其它字符串变量。

这种方式在可读性上秒杀format()方式，处理长字符串的拼接时，速度与join()方法相当。

尽管如此，这种方式与其它某些编程语言相比，还是欠优雅，因为它引入了一个 f 标识。而其它某些程序语言可以更简练，比如shell：

name="world"
myname="python_cat"
words="hello ${name}. my name is ${myname}."
echo $words
>>>hello world. my name is python_cat.

总结一下，我们前面说的“字符串拼接”，其实是从结果上理解。若从实现原理上划分的话，我们可以将这些方法划分出三种类型：

格式化类：%、format()、template

拼接类：+、()、join()

插值类：f-string

当要处理字符串列表等序列结构时，采用join()方式；拼接长度不超过20时，选用+号操作符方式；长度超过20的情况，高版本选用f-string，低版本时看情况使用format()或join()方式。

one more thing：
你以为这就要结束了？

图样！这不是我的风格！

我的风格是发散思考、系统思考、以及追求编程哲学的思考。

最近，我在读《黑客与画家》，保罗•格雷厄姆在书中提出了这个问题：

从语义上看，字符串或多或少可以理解成列表的一个子集，其中的每一个元素都是字符。那么，为什么还需要把字符串单列为一种数据结构呢？

作者认为“编程语言设置字符串似乎就是一个过早优化的例子”，这个观点令我大为震撼！前文提到的七种拼接字符串的方法瞬间变成纸，薄得似乎一触就破。

但是，作者认为这还不够，他还有更惊人想法：

还有比这更惊人的预言。在逻辑上其实不需要对整数设置单独的表示法，因为可以把它们也看作列表，整数n可以用一个n元素的列表表示。… 编程语言会发展到放弃基本数据类型之一的整数这一步吗？

上一篇：你的年终奖

下一篇：使用vue封装一个tab栏切换的左侧导航栏的公共组件

Python动态赋值的陷阱知识点总结

浅谈Python 列表字典赋值的陷阱

python 解决动态的定义变量名,并给其赋值的方法(大数据处理)

Python中的引用知识点总结

python的继承知识点总结

Python动态赋值的陷阱知识点总结

Python基础总结之第八天开始【while循环以及for循环,循环嵌套等循环相关的知识点】（新手可相互督促）

python的launcher用法知识点总结

前人总结出的一些学Python中的陷阱和技巧，非常受用！

python pyg2plot的原理知识点总结

Python中的反射知识点总结