本文主要是记录一下python,比较详尽的python学习资料:
Python学习笔记_王纯业 http://pan.baidu.com/s/1eQrDEYA
部分有详细的博文链接
1.字符串:
切片 s[a:b] :返回的是 [a,b)的子串
长度: len(s)
字符串的替换方法有两种:
last_date = “1/2/3” 目标为"123"
之一:repalce
date =last_date.replace('/','')
之二:re
p = re.compile("/")
date = p.sub('', last_date)
注意事项是:
一定不要转义,否则函数不会生效。
2.日期:
from datetime import date
import datetime
定义时间年月日:d = date(yyyy,mm,dd)
多少天之后:d += datetime.timedelta(days=10)
格式控制:d.strftime('%Y:%m:%d')
两个日期相隔多少天:abs( (d1-d2).days )
3.文件操作方式:
fin = open('data.txt')
读取一行:fin.readline()
4.文件格式编码问题:
fin = open('词典.txt','rb') t = fin.read() txt = t.decode("gb2312", "ignore") fin.close()
fin = open('训练语料库.txt',encoding='UTF-8') #UTF8读取,因为涉及到编码解码问题 txt = fin.read() fin.close()
5.切片
字符串、列表、元组在python中都符合“序列”这一特征,只要符合这一特征的变量我们都可以用切片(slice)去存取它们的任意部分。我们可以把序列想像成一个队列,我可能需要前面三位、后面三位、或从第三位后的四位、或隔一个取一个等,我们用切片操作符来实现上述要求。
切片操作符在python中的原型是
[start:stop:step]即:[开始索引:结束索引:步长值]
开始索引:同其它语言一样,从0开始。序列从左向右方向中,第一个值的索引为0,最后一个为-1
结束索引:切片操作符将取到该索引为止,不包含该索引的值。
步长值:默认是一个接着一个切取,如果为2,则表示进行隔一取一操作。步长值为正时表示从左向右取,如果为负,则表示从右向左取。步长值不能为0
li = [1,2,3,4,5,6,7] print li[1:] #输出[2,3,4,5,6,7],省略终止索引,表示取起始索引之后的所有值, 等效于li[1:len(li)] print li[:3] #输出[1,2,3],省略起始索引,表示从0开始取,等效于li[0:3] print li[:] #输出[1,2,3,4,5,6,7],省略起始索引、终止索引、步长值表示取全部, 等效于li[0:len(li):1] print li[::] #输出[1,2,3,4,5,6,7],省略起始索引、终止索引、步长值表示取全部, 等效于li[0:len(li):1] print li[::-1] #输出[7,6,5,4,3,2,1],省略起始索引、终止索引,步长值为-1,表示反向获取
6. map介绍:第一个参数接收一个函数名,第二个参数接收一个可迭代对象
lt = [1, 2, 3, 4, 5, 6] def add(num): return num + 1 rs = map(add, lt) print rs #[2,3,4,5,6,7]
7. ZIP介绍:
x = [1, 2, 3, 4, 5 ] y = [6, 7, 8, 9, 10] print zip(x, y) # [(1, 6), (2, 7), (3, 8), (4, 9), (5, 10)]
8. 跨平台操作的文件路径:
linux: /home/XXX
windows: C:\Windows
可见在不同的平台上文件路径使用的文件分隔符不一样。
在python中,我们可以使用os.path.sep作为文件分隔符。
a+os.path.sep+b+os.path.sep+c
a+os.path.sep+b+os.path.sep+c 我们也可以写成 os.path.join(a,b,c) 。类似的操作还有:os.path.split();
Linux下命令:from os import system cmd = 'ls' s = system(cmd) print str(s)
10. 如果想输出转义字符串的原始字符串(转义字符非转义,对字符串不进行转义),我们可以用repr方式:repr('dsa\nres')的输出方式是: 'dsa\nres' 普通的为: dsa res
11. Python中所有对象都是指针,对象的拷贝不能直接使用=号进行拷贝,应该使用copy.deepcopy()
12.安装setuptools: https://pypi.python.org/pypi/setuptools#windows-simplified安装pip:https://pypi.python.org/pypi/pip#downloads