学Python的第三天——字符串和常用数据结构
使用字符串
第二次世界大战促使了现代电子计算机的诞生,当初的想法很简单,就是用计算机来计算导弹的弹道,因此在计算机刚刚诞生的那个年代,计算机处理的信息主要是数值,而世界上的第一台电子计算机ENIAC每秒钟能够完成约5000次浮点运算。随着时间的推移,虽然对数值运算仍然是计算机日常工作中最为重要的事情之一,但是今天的计算机处理得更多的数据都是以文本信息的方式存在的,而Python表示文本信息的方式我们在很早以前就说过了,那就是字符串类型。所谓“字符串”,就是由零个或多个字符组成的有限序列。
我们可以通过下面的代码来了解字符串的使用。
(1)
str1 = 'hello, world!'
# 通过len函数计算字符串的长度
print(len(str1)) # 13
# 获得字符串首字母大写的拷贝
print(str1.capitalize()) # Hello, world!
# 获得字符串变大写后的拷贝
print(str1.upper()) # HELLO, WORLD!
# 从字符串中查找子串所在位置 #没有子串显示的位置是-1
print(str1.find('or')) # 8
print(str1.find('shit')) # -1
# 检查字符串是否以指定的字符串开头
print(str1.startswith('He')) # False
print(str1.startswith('hel')) # True
# 检查字符串是否以指定的字符串结尾
print(str1.endswith('!')) # True
(2)
str2 = 'abc123456'
# 从字符串中取出指定位置的字符(下标运算)
print(str2[2]) # c
# 字符串切片(从指定的开始索引到指定的结束索引)
print(str2[2:5]) # c12
print(str2[2:]) # c123456
print(str2[2::2]) # c246
print(str2[::2]) # ac246
print(str2[::-1]) # 654321cba
print(str2[-3:-1]) # 45
# 检查字符串是否由数字构成
print(str2.isdigit()) # False
# 检查字符串是否以字母构成
print(str2.isalpha()) # False
# 检查字符串是否以数字和字母构成
print(str2.isalnum()) # True
(3)
str3 = ' [email protected] '
# 获得字符串修剪左右两侧空格的拷贝
print(str3.strip())
print(str3.lstrip())
print(str3.rstrip())
除了字符串,Python还内置了多种类型的数据结构,如果要在程序中保存和操作数据,绝大多数时候可以利用现有的数据结构来实现,最常用的包括列表、元组、集合和字典。
使用列表
下面的代码演示了如何定义列表、使用下标访问列表元素以及添加和删除元素的操作。
list1 = [1, 3, 5, 7, 100]
# 计算列表长度(元素个数)
print(len(list1))
# 添加元素
list1.append(200)
list1.insert(1, 400)
print(list1)
# 删除元素
list1.remove(3)
print(list1)
# 清空列表元素
list1.clear()
print(list1)
下面的代码实现了对列表的排序操作。
list1 = ['orange', 'apple', 'zoo', 'internationalization', 'blueberry']
# 默认排序是升序
list2 = sorted(list1)
print(list2)
# 函数的设计就应该像sorted函数一样尽可能不产生副作用
list3 = sorted(list1, reverse=True)
print(list3)
# 通过key关键字参数指定根据字符串长度进行排序而不是默认的字母表顺序
list4 = sorted(list1, key=len)
print(list4)
# 给列表对象发出排序消息直接在列表对象上进行排序
list1.sort(reverse=True)
print(list1)
使用元组
Python 的元组与列表类似,不同之处在于元组的元素不能修改,在前面的代码中我们已经不止一次使用过元组了。顾名思义,我们把多个元素组合到一起就形成了一个元组,所以它和列表一样可以保存多条数据。下面的代码演示了如何定义和使用元组。
# 定义元组
t = ('熊大', 88, True, '东北吉林')
print(t)
# 获取元组中的元素
print(t[0])
print(t[3])
# 遍历元组中的值
for member in t:
print(member)
# 重新给元组赋值
t[0] = '熊二'
print(t)
# 变量t重新引用了新的元组原来的元组将被垃圾回收
t = ('光头强', 33, True, '东北吉林')
# 将元组转换成列表
person = list(t)
print(person)
# 列表是可以修改它的元素的
person[0] = '吉吉'
person[1] = 10
print(person)
# 将列表转换成元组
fruits_list = ['apple', 'banana', 'orange']
ruits_tuple = tuple(fruits_list)
print(fruits_tuple)
这里有一个非常值得探讨的问题,我们已经有了列表这种数据结构,为什么还需要元组这样的类型呢?
答:元组中的元素是无法修改的,事实上我们在项目中尤其是在多线程环境中可能更喜欢使用的是那些不变对象(一方面因为对象状态不能修改,所以可以避免由此引起的不必要的程序错误,简单的说就是一个不变的对象要比可变的对象更加容易维护;另一方面因为没有任何一个线程能够修改不变对象的内部状态,一个不变对象自动就是线程安全的,这样就可以省掉处理同步化的开销。一个不变对象可以方便的被共享访问)。所以结论就是:如果不需要对元素进行添加、删除、修改的时候,可以考虑使用元组,当然如果一个方法要返回多个值,使用元组也是不错的选择。
2. 元组在创建时间和占用的空间上面都优于列表。我们可以使用sys模块的getsizeof函数来检查存储同样的元素的元组和列表各自占用了多少内存空间,这个很容易做到。我们也可以在ipython中使用魔法指令%timeit来分析创建同样内容的元组和列表所花费的时间。
使用集合
Python中的集合跟数学上的集合是一致的,不允许有重复元素,而且可以进行交集、并集、差集等运算。
set1 = {1, 2, 3, 3, 3, 2}
print(set1)
set2 = set(range(1, 10))
print(set2)
# 将元组转换成集合
set3 = set((1, 2, 3, 3, 2, 1))
print(set3.pop())
print(set3)
# 集合的交集、并集、差集、对称差运算
print(set1 & set2)
print(set1 | set2)
print(set1 - set2)
print(set1 ^ set2)
说明:Python中允许通过一些特殊的方法来为某种类型或数据结构自定义运算符,上面的代码中我们对集合进行运算的时候可以调用集合对象的方法,也可以直接使用对应的运算符,例如&
运算符跟intersection方法的作用就是一样的,但是使用运算符让代码更加直观。
使用字典
字典是另一种可变容器模型,类似于我们生活中使用的字典,它可以存储任意类型对象,与列表、集合不同的是,字典的每个元素都是由一个键和一个值组成的“键值对”,键和值通过冒号分开。下面的代码演示了如何定义和使用字典。
# 字典的一切操作都是通过键名操作键值!
# 字典是无序的,没有索引操作,除非转换成有序字典!
dict = {key:value}
def main():
scores = {'熊大': 95, '熊二': 90, '光头强': 100}
# 通过键可以获取字典中对应的值
print(scores['熊大'])
print(scores['熊二'])
# 对字典进行遍历(遍历的其实是键再通过键取对应的值)
for elem in scores:
print('%s\t--->\t%d' % (elem, scores[elem]))
# 更新字典中的元素
scores['熊大'] = 80
scores['熊二'] = 70
scores.update(吉吉=67, 小白=85)
print(scores)
# get方法也是通过键获取对应的值但是可以设置默认值
print(scores.get('吉吉', 60))
# 删除字典中的元素
print(scores.popitem())
print(scores.pop('熊大', 80))
# 清空字典
scores.clear()
print(scores)
# 同时获取键值对
for key,value in dict_.items():
print(key,value)
# 获取键名
print(dict_.keys())
# 获取键值
print(dict_.values())
练习
1题
def tzx(num):
num1 = float(num)
num2 =str(num1)
if 48 <= ord(num2) <= 57:
print('是数字')
else:
print('不是')
def Start():
num = input('请输入:')
tzx(num)
Start()
2题
import random
name = random.choice(['熊大','熊二','光头强','吉吉']) #随机产生定义的数组
def tzx():
print(name)
tzx()
3题
删除空格
a = ' a b c de f g '
b = ' '
for i in a:
if i !=" ":
b +=i
print(b)
4题
去重
a = [1,1,2,3,1,4,5,3,1,6,6]
b = []
for i in a:
if i not in b :
b.append(i)
print(b)
5题
list1 = ['a','aa','aaaaaa','aaaa','aaaaaaaaa','aaaaaaa']
list2 = sorted(list1,key = lambda x:len(x))
print(list2)