欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python 2.7.x 和 3.x 版本的重要区别小结

程序员文章站 2022-06-08 10:00:14
许多python初学者都会问:我应该学习哪个版本的python。对于这个问题,我的回答通常是“先选择一个最适合你的python教程,教程中使用哪个版本的python,你就用...

许多python初学者都会问:我应该学习哪个版本的python。对于这个问题,我的回答通常是“先选择一个最适合你的python教程,教程中使用哪个版本的python,你就用那个版本。等学得差不多了,再来研究不同版本之间的差别”。

但如果想要用python开发一个新项目,那么该如何选择python版本呢?我可以负责任的说,大部分python库都同时支持python 2.7.x和3.x版本的,所以不论选择哪个版本都是可以的。但为了在使用python时避开某些版本中一些常见的陷阱,或需要移植某个python项目时,依然有必要了解一下python两个常见版本之间的主要区别。

目录

__future__模块

[回到目录]

python 3.x引入了一些与python 2不兼容的关键字和特性,在python 2中,可以通过内置的__future__模块导入这些新内容。如果你希望在python 2环境下写的代码也可以在python 3.x中运行,那么建议使用__future__模块。例如,如果希望在python 2中拥有python 3.x的整数除法行为,可以通过下面的语句导入相应的模块。

from __future__ import division

下表列出了__future__中其他可导入的特性:

特性 可选版本 强制版本 效果
nested_scopes 2.1.0b1 2.2 pep 227:
statically nested scopes
generators 2.2.0a1 2.3 pep 255:
simple generators
division 2.2.0a2 3.0 pep 238:
changing the division operator
absolute_import 2.5.0a1 3.0 pep 328:
imports: multi-line and absolute/relative
with_statement 2.5.0a1 2.6 pep 343:
the “with” statement
print_function 2.6.0a2 3.0 pep 3105:
make print a function
unicode_literals 2.6.0a2 3.0 pep 3112:
bytes literals in python 3000

(来源: )

示例:

from platform import python_version

print函数

[回到目录]

虽然print语法是python 3中一个很小的改动,且应该已经广为人知,但依然值得提一下:python 2中的print语句被python 3中的print()函数取代,这意味着在python 3中必须用括号将需要输出的对象括起来。

在python 2中使用额外的括号也是可以的。但反过来在python 3中想以python2的形式不带括号调用print函数时,会触发syntaxerror。

python 2

print 'python', python_version()
print 'hello, world!'
print('hello, world!')
print "text", ; print 'print more text on the same line'
python 2.7.6
hello, world!
hello, world!
text print more text on the same line

python 3

print('python', python_version())
print('hello, world!')
 
print("some text,", end="") 
print(' print more text on the same line')
python 3.4.1
hello, world!
some text, print more text on the same line
print 'hello, world!'
file "<ipython-input-3-139a7c5835bd>", line 1
print 'hello, world!'
^
syntaxerror: invalid syntax

注意:

在python中,带不带括号输出”hello world”都很正常。但如果在圆括号中同时输出多个对象时,就会创建一个元组,这是因为在python 2中,print是一个语句,而不是函数调用。

print 'python', python_version()
print('a', 'b')
print 'a', 'b'
python 2.7.7
('a', 'b')
a b

整数除法

[回到目录]

由于人们常常会忽视python 3在整数除法上的改动(写错了也不会触发syntax error),所以在移植代码或在python 2中执行python 3的代码时,需要特别注意这个改动。

所以,我还是会在python 3的脚本中尝试用float(3)/2或 3/2.0代替3/2,以此来避免代码在python 2环境下可能导致的错误(或与之相反,在python 2脚本中用from __future__ import division来使用python 3的除法)。

python 2

print 'python', python_version()
print '3 / 2 =', 3 / 2
print '3 // 2 =', 3 // 2
print '3 / 2.0 =', 3 / 2.0
print '3 // 2.0 =', 3 // 2.0
python 2.7.6
3 / 2 = 1
3 // 2 = 1
3 / 2.0 = 1.5
3 // 2.0 = 1.0

python 3

print('python', python_version())
print('3 / 2 =', 3 / 2)
print('3 // 2 =', 3 // 2)
print('3 / 2.0 =', 3 / 2.0)
print('3 // 2.0 =', 3 // 2.0)
python 3.4.1
3 / 2 = 1.5
3 // 2 = 1
3 / 2.0 = 1.5
3 // 2.0 = 1.0

unicode

[回到目录]

python 2有基于ascii的str()类型,其可通过单独的unicode()函数转成unicode类型,但没有byte类型。

而在python 3中,终于有了unicode(utf-8)字符串,以及两个字节类:bytes和bytearrays。

python 2

print 'python', python_version()
python 2.7.6
print type(unicode('this is like a python3 str type'))
<type 'unicode'>
print type(b'byte type does not exist')
<type 'str'>
print 'they are really' + b' the same'
they are really the same
print type(bytearray(b'bytearray oddly does exist though'))
<type 'bytearray'>

python 3

print('python', python_version())
print('strings are now utf-8 u03bcnicou0394é!')
python 3.4.1
strings are now utf-8 μnicoδé!
print('python', python_version(), end="")
print(' has', type(b' bytes for storing data'))
python 3.4.1 has <class 'bytes'>
print('and python', python_version(), end="")
print(' also has', type(bytearray(b'bytearrays')))
and python 3.4.1 also has <class 'bytearray'>
'note that we cannot add a string' + b'bytes for data'
---------------------------------------------------------------------------
typeerror traceback (most recent call last)
<ipython-input-13-d3e8942ccf81> in <module>()
----> 1 'note that we cannot add a string' + b'bytes for data'
 
typeerror: can't convert 'bytes' object to str implicitly

xrange

[回到目录]

在python 2.x中,经常会用xrange()创建一个可迭代对象,通常出现在“for循环”或“列表/集合/字典推导式”中。

这种行为与生成器非常相似(如”惰性求值“),但这里的xrange-iterable无尽的,意味着可能在这个xrange上无限迭代。

由于xrange的“惰性求知“特性,如果只需迭代一次(如for循环中),range()通常比xrange()快一些。不过不建议在多次迭代中使用range(),因为range()每次都会在内存中重新生成一个列表。

在python 3中,range()的实现方式与xrange()函数相同,所以就不存在专用的xrange()(在python 3中使用xrange()会触发nameerror)。

import timeit
 
n = 10000
def test_range(n):
 return for i in range(n):
 pass
 
def test_xrange(n):
 for i in xrange(n):
 pass

python 2

print 'python', python_version()
 
print 'ntiming range()'
%timeit test_range(n)
 
print 'nntiming xrange()'
%timeit test_xrange(n)
python 2.7.6
 
timing range()
1000 loops, best of 3: 433 µs per loop
 
timing xrange()
1000 loops, best of 3: 350 µs per loop

python 3

print('python', python_version())
 
print('ntiming range()')
%timeit test_range(n)
python 3.4.1
 
timing range()
1000 loops, best of 3: 520 µs per loop
print(xrange(10))
---------------------------------------------------------------------------
nameerror traceback (most recent call last)
in ()
----> 1 print(xrange(10))
 
nameerror: name 'xrange' is not defined

python 3中的range对象中的__contains__方法

另一个值得一提的是,在python 3.x中,range有了一个新的__contains__方法。__contains__方法可以有效的加快python 3.x中整数和布尔型的“查找”速度。

x = 10000000
def val_in_range(x, val):
 return val in range(x)
 
def val_in_xrange(x, val):
 return val in xrange(x)
 
print('python', python_version())
assert(val_in_range(x, x/2) == true)
assert(val_in_range(x, x//2) == true)
%timeit val_in_range(x, x/2)
%timeit val_in_range(x, x//2)
python 3.4.1
1 loops, best of 3: 742 ms per loop
1000000 loops, best of 3: 1.19 µs per loop

根据上面的timeit的结果,查找整数比查找浮点数要快大约6万倍。但由于python 2.x中的range或xrange没有__contains__方法,所以在python 2中的整数和浮点数的查找速度差别不大。

print 'python', python_version()
 
assert(val_in_xrange(x, x/2.0) == true)
assert(val_in_xrange(x, x/2) == true)
assert(val_in_range(x, x/2) == true)
assert(val_in_range(x, x//2) == true)
%timeit val_in_xrange(x, x/2.0)
%timeit val_in_xrange(x, x/2)
%timeit val_in_range(x, x/2.0)
%timeit val_in_range(x, x/2)
python 2.7.7
1 loops, best of 3: 285 ms per loop
1 loops, best of 3: 179 ms per loop
1 loops, best of 3: 658 ms per loop
1 loops, best of 3: 556 ms per loop

下面的代码证明了python 2.x中没有__contain__方法:

print('python', python_version())
range.__contains__
python 3.4.1
<slot wrapper '__contains__' of 'range' objects
print('python', python_version())
range.__contains__
python 2.7.7
---------------------------------------------------------------------------
attributeerror traceback (most recent call last)
<ipython-input-7-05327350dafb> in <module>()
1 print 'python', python_version()
----> 2 range.__contains__
 
attributeerror: 'builtin_function_or_method' object has no attribute '__contains__'
print('python', python_version())
xrange.__contains__
python 2.7.7
 
---------------------------------------------------------------------------
attributeerror traceback (most recent call last)
in ()
1 print 'python', python_version()
----> 2 xrange.__contains__
 
attributeerror: type object 'xrange' has no attribute '__contains__'

关于python 2中xrange()与python 3中range()之间的速度差异的一点说明:

有读者指出了python 3中的range()和python 2中xrange()执行速度有差异。由于这两者的实现方式相同,因此理论上执行速度应该也是相同的。这里的速度差别仅仅是因为python 3的总体速度就比python 2慢。

def test_while():
 i = 0
 while i < 20000:
  i += 1
 return
print('python', python_version())
%timeit test_while()
python 3.4.1
%timeit test_while()
100 loops, best of 3: 2.68 ms per loop
print 'python', python_version()
%timeit test_while()
python 2.7.6
1000 loops, best of 3: 1.72 ms per loop

触发异常

[回到目录]

python 2支持新旧两种异常触发语法,而python 3只接受带括号的的语法(不然会触发syntaxerror):

python 2

print 'python', python_version()
python 2.7.6
raise ioerror, "file error"
---------------------------------------------------------------------------
ioerror traceback (most recent call last)
<ipython-input-8-25f049caebb0> in <module>()
----> 1 raise ioerror, "file error"
 
ioerror: file error
raise ioerror("file error")
---------------------------------------------------------------------------
ioerror traceback (most recent call last)
<ipython-input-9-6f1c43f525b2> in <module>()
----> 1 raise ioerror("file error")
 
ioerror: file error

python 3

print('python', python_version())
python 3.4.1
raise ioerror, "file error"
file "<ipython-input-10-25f049caebb0>", line 1
raise ioerror, "file error"
^
syntaxerror: invalid syntax
the proper way to raise an exception in python 3:
print('python', python_version())
raise ioerror("file error")
python 3.4.1
 
---------------------------------------------------------------------------
oserror traceback (most recent call last)
<ipython-input-11-c350544d15da> in <module>()
1 print('python', python_version())
----> 2 raise ioerror("file error")
 
oserror: file error

异常处理

[回到目录]

python 3中的异常处理也发生了一点变化。在python 3中必须使用“as”关键字。

python 2

print 'python', python_version()
try:
 let_us_cause_a_nameerror
except nameerror, err:
 print err, '--> our error message'
python 2.7.6
name 'let_us_cause_a_nameerror' is not defined --> our error message

python 3

print('python', python_version())
try:
 let_us_cause_a_nameerror
except nameerror as err:
 print(err, '--> our error message')
python 3.4.1
name 'let_us_cause_a_nameerror' is not defined --> our error message

next()函数和.next()方法

[回到目录]

由于会经常用到next()(.next())函数(方法),所以还要提到另一个语法改动(实现方面也做了改动):在python 2.7.5中,函数形式和方法形式都可以使用,而在python 3中,只能使用next()函数(试图调用.next()方法会触发attributeerror)。

python 2

print 'python', python_version()
my_generator = (letter for letter in 'abcdefg')
next(my_generator)
my_generator.next()
python 2.7.6
'b'

python 3

print('python', python_version())
my_generator = (letter for letter in 'abcdefg')
next(my_generator)
python 3.4.1
'a'
my_generator.next()
---------------------------------------------------------------------------
attributeerror traceback (most recent call last)
<ipython-input-14-125f388bb61b> in <module>()
----> 1 my_generator.next()
 
attributeerror: 'generator' object has no attribute 'next'

for循环变量与全局命名空间泄漏

[回到目录]

好消息是:在python 3.x中,for循环中的变量不再会泄漏到全局命名空间中了!

这是python 3.x中做的一个改动,在“what's new in python 3.0”中有如下描述:

“列表推导不再支持[... for var in item1, item2, ...]这样的语法,使用[... for var in (item1, item2, ...)]代替。还要注意列表推导有不同的语义:现在列表推导更接近list()构造器中的生成器表达式这样的语法糖,特别要注意的是,循环控制变量不会再泄漏到循环周围的空间中了。”

python 2

print 'python', python_version()
 
i = 1
print 'before: i =', i
 
print 'comprehension: ', [i for i in range(5)]
 
print 'after: i =', i
python 2.7.6
before: i = 1
comprehension: [0, 1, 2, 3, 4]
after: i = 4

python 3

print('python', python_version())
 
i = 1
print('before: i =', i)
 
print('comprehension:', [i for i in range(5)])
 
print('after: i =', i)
python 3.4.1
before: i = 1
comprehension: [0, 1, 2, 3, 4]
after: i = 1

比较无序类型

[回到目录]

python 3中另一个优秀的改动是,如果我们试图比较无序类型,会触发一个typeerror。

python 2

print 'python', python_version()
print "[1, 2] > 'foo' = ", [1, 2] > 'foo'
print "(1, 2) > 'foo' = ", (1, 2) > 'foo'
print "[1, 2] > (1, 2) = ", [1, 2] > (1, 2)
python 2.7.6
[1, 2] > 'foo' = false
(1, 2) > 'foo' = true
[1, 2] > (1, 2) = false

python 3

print('python', python_version())
print("[1, 2] > 'foo' = ", [1, 2] > 'foo')
print("(1, 2) > 'foo' = ", (1, 2) > 'foo')
print("[1, 2] > (1, 2) = ", [1, 2] > (1, 2))
python 3.4.1
---------------------------------------------------------------------------
typeerror traceback (most recent call last)
<ipython-input-16-a9031729f4a0> in <module>()
1 print('python', python_version())
----> 2 print("[1, 2] > 'foo' = ", [1, 2] > 'foo')
3 print("(1, 2) > 'foo' = ", (1, 2) > 'foo')
4 print("[1, 2] > (1, 2) = ", [1, 2] > (1, 2))
typeerror: unorderable types: list() > str()

通过input()解析用户的输入

[回到目录]

幸运的是,python 3改进了input()函数,这样该函数就会总是将用户的输入存储为str对象。在python 2中,为了避免读取非字符串类型会发生的一些危险行为,不得不使用raw_input()代替input()。

python 2

python 2.7.6
[gcc 4.0.1 (apple inc. build 5493)] on darwin
type "help", "copyright", "credits" or "license" for more information.
 
>>> my_input = input('enter a number: ')
 
enter a number: 123
 
>>> type(my_input)
<type 'int'>
 
>>> my_input = raw_input('enter a number: ')
 
enter a number: 123
 
>>> type(my_input)
<type 'str'>

python 3

python 3.4.1
[gcc 4.2.1 (apple inc. build 5577)] on darwin
type "help", "copyright", "credits" or "license" for more information.
 
>>> my_input = input('enter a number: ')
enter a number: 123
>>> type(my_input)
<class 'str'>

返回可迭代对象,而不是列表

[回到目录]

在xrange一节中可以看到,某些函数和方法在python中返回的是可迭代对象,而不像在python 2中返回列表。

由于通常对这些对象只遍历一次,所以这种方式会节省很多内存。然而,如果通过生成器来多次迭代这些对象,效率就不高了。

此时我们的确需要列表对象,可以通过list()函数简单的将可迭代对象转成列表。

python 2

print 'python', python_version()
 
print range(3)
print type(range(3))
python 2.7.6
[0, 1, 2]
<type 'list'>

python 3

print('python', python_version())
print(range(3))
print(type(range(3)))
print(list(range(3)))
python 3.4.1
range(0, 3)
<class 'range'>
[0, 1, 2]

下面列出了python 3中其他不再返回列表的常用函数和方法:

  • zip()
  • map()
  • filter()
  • 字典的.key()方法
  • 字典的.value()方法
  • 字典的.item()方法

更多关于python 2和python 3的文章

[回到目录]

下面列出了其他一些可以进一步了解python 2和python 3的优秀文章,

//迁移到 python 3

// 对python 3的褒与贬