python网络编程学习笔记(一)
学习用书:《python 网络编程基础》作者john goerzen
第一部分底层网络学习
python提供了访问底层操作系统socket接口的全部方法,需要的时候这些接口可以提供灵活而强有力的功能。
(1)基本客户端操作
在《python 网络编程基础》一书中,作者列出了一个简单的python客户端程序,具体如下:
import socket,sys
port =70
host=sys.argv[1]
filename=sys.argv[2]
s=socket.socket(socket.af_inet,socket.sock_stream)
s.connect((host,port))
s.sendall(filename+"\r\n")
while 1:
buf=s.recv(2048)
if not len(buf):
break
sys.stdout.write(buf)
该程序实现的是gopher协议,实现从主机上请求相关文档的功能。(gopher是internet上一个非常有名的信息查找系统,它将internet上的文件组织成某种索引,很方便地将用户从internet的一处带到另一处。在www出现之前,gopher是internet上最主要的信息检索工具,gopher站点也是最主要的站点。但在www出现后,gopher失去了昔日的辉煌。现在它基本很少被使用。)
于是,我按照书上的语句进行了一下测试,在dos下运行python gopherclient.py quux.org。但是系统提示为
traceback (most recent call last):
file "gopherclient.py", line 5, i
filename=sys.argv[2]
indexerror: list index out of range
看了一下,sys.argv只有两个元素['gopherclient.py', 'quux.org/']所以filename=sys.argv[2]就超出下界了。可是为什么会出现这个原因呢?是书里面写错了吗,因为我也是初学socket,不是很了解,所以我也是没有找到原因,如果哪位大牛知道是什么原因,希望能给讲解一下。
(2)基本服务器操作
《python 网络编程基础》一书中同样给出了一个简单的服务器程序,具体如下:
import socket
host=''
port=51423
s=socket.socket(socket.af_inet,socket.sock_stream,0)
s.setsockopt(socket.sol_socket,socket.so_reuseaddr,1)
s.bind((host,port))
s.listen(1)
print "server is running on port %d;press ctrl-c to terminate." %port
while 1:
clientsock,clientaddr=s.accept()
clientfile=clientsock.makefile('rw',0)
clientfile.write("welcome,"+str(clientaddr)+'\n')
clientfile.write("please enter a string:")
line=clientfile.readline().strip()
clientfile.write("you entered %d characters.\n" %len(line))
clientfile.close()
clientsock.close()
该程序运行后,提示“server is running on port 51423:press ctrl-c to terminate”。此时,通过另一台机器telnet本机器的51423端口,如telnet 127.0.0.1:51423,此时会提示welcome 127.0.0.1 ****,please enter a string:。 然后输入几个字符后,会返回你输入字符的个数。
这里就该程序进行一下分析:
1、首先导入socket模块,给host和port赋值。
2、调用socket.socket()来建立一个socket赋值给s。socket.socket(domain, type, protocol).domain参数的值有af_unix,af_local,af_inet,pf_unix,pf_local,pf_inet。这几个值中af_unix=af_local, pf_unix=pf_local, af_local=pf_local, af_inet=pf_inet。一般来说,af 表示address family 地址族,pf 表示protocol family 协议族,但这两个宏定义是一样的,所以使用哪个都没有关系。参数type指定socket的类型:sock_stream提供有序、可靠、双向及基于连接的字节流。sock_dgram支持数据报。sock_seqpacket提供有序、可靠、双向及基于连接的数据报通信。sock_raw提供对原始网络协议的访问。sock_rdm提供可靠的数据报层,但是不保证有序性。protocol一般取0(为什么取0我也没搞清楚,放在以后明白了再写上吧)。
3、s.setsockopt(socket.sol_socket,socket.so_reuseaddr,1)。setsockopt()函数用于任意类型、任意状态套接口的设置选项值。尽管在不同协议层上存在选项,但本函数仅定义了最高的“套接口”层次上的选项。选项影响套接口的操作,诸如加急数据是否在普通数据流中接收,广播数据是否可以从套接口发送等等。 这个函数中,第一个参数为协议层参数,指明了希望访问一个选项所在的协议栈。通常我们需要使用下面中的一个:
sol_socket来访问套接口层选项
sol_tcp来访问tcp层选项
第二个参数是与第一个参数相对应的。第一个参数决定了协议层level,第二个参数决定了该协议层下选项组合。sol_socket的选项组合如下:
协议层 选项名字
sol_socket so_reuseaddr
sol_socket so_kkepalive
sol_socket so_linger
sol_socket so_broadcast
sol_socket so_oobinline
sol_socket so_sndbuf
sol_socket so_rcvbuf
sol_socket so_type
sol_socket so_error
具体的一些组合用法可见:http://wenku.baidu.com/view/23013b7101f69e3143329402.html
第三个参数设为1,这里我也没很明白其中的意思,我试着把1换成50,结果是一样的。换成0也是可以的,没发现什么区别。希望大牛们给指点一下。
4、s.bind((host,port))绑定主机端口。
5、s.listen(1):listen函数使用主动连接套接口变为被连接套接口,使得一个进程可以接受其它进程的请求,从而成为一个服务器进程。在tcp服务器编程中listen函数把进程变为一个服务器,并指定相应的套接字变为被动连接。这里的参数涉及到一些网络的细节。在进程正理一个一个连接请求的时候,可能还存在其它的连接请求。因为tcp连接是一个过程,所以可能存在一种半连接的状态,有时由于同时尝试连接的用户过多,使得服务器进程无法快速地完成连接请求。如果这个情况出现了,服务器进程希望内核如何处理呢?内核会在自己的进程空间里维护一个队列以跟踪这些完成的连接但服务器进程还没有接手处理或正在进行的连接,这样的一个队列内核不可能让其任意大,所以必须有一个大小的上限。这个backlog告诉内核使用这个数值作为上限。毫无疑问,服务器进程不能随便指定一个数值,内核有一个许可的范围。这个范围是实现相关的。很难有某种统一,一般这个值会小30以内。这里设定为1表示每次最多只有一个等候处理的连接。
6、while循环从accept()函数开始。程序会在连接了一个客户端后关闭socket。当某个客户端连接的时,accept返回两个信息,一个新的连接客户端socket和客户端的ip地址、端口号。如在上面的例子中添加print语句输出clientsock和clientaddr,你会发现clientsock为socket.socketobject,clientaddr=('客户端ip',端口)。后面的循环中使用了文件类对象,服务器接着显示出一些介绍性信息,从客户端读一个字符串,显示一个应答,最后关闭客户端socket。