python实现代理服务功能实例
程序员文章站
2023-11-04 11:18:10
代理服务原理很简单,就拿浏览器与web服务器来说。无非是a浏览器发request给b代理,b代理再把request把送给c web服务,然后c的reponse->b-...
代理服务原理很简单,就拿浏览器与web服务器来说。无非是a浏览器
发request给b代理,b代理再把request把送给c web服务,然后c的reponse->b->a。
要写web代理服务就要先了解下http协议,当然并不要多深入,除非要实现强大的功能:修改xx信息、
负载均衡等。http请求由三部分组成:请求行、消息报头、请求正文;
详细的网上有,想了解可以看看。下面是一个正常的get请求头(cookie部分本人没截屏,使用的系统w7):
可以看到首行:get是请求方法, /是路径,在后面是协议版本;第二行以后是请求报头,都是键值对形式;
get方法没有正文。post有正文,除此之外,请求方法头部基本一致,每一行结尾都是\r\n。
基本的请求方法,如下:
get 请求获取request-uri所标识的资源
post 在request-uri所标识的资源后附加新的数据
head 请求获取由request-uri所标识的资源的响应消息报头
put 请求服务器存储一个资源,并用request-uri作为其标识
delete 请求服务器删除request-uri所标识的资源
trace 请求服务器回送收到的请求信息,主要用于测试或诊断
connect 保留将来使用
options 请求查询服务器的性能,或者查询与资源相关的选项和需求
但是使用代理后,从代理服务上得到的请求如下:
与第一张图片对比一下,有什么不同......第一行的资源路径不对。当浏览器上设置代理请求时把整个url都作为资源路径了,所以我们要把域名删掉,然后代理服务器在把修改后的请求发送给目标
web服务器。就这么简单,当然connect方法特别,要特别对待,所以先说其他方法。
基本的思路:
1、代理服务器运行监听,当有客户端浏览器请求到来时通过accept()获得client句柄(或者叫描述符);
2、利用client描述符接收浏览器发来的request,分离出第一行为了修改第一行和获得method,
要去掉的的部分,除去http://的部分用targethost表示吧。
3、通过第2步能够获得方法method、request和targethost,这一步可以根据不同的method做不同的处理,
由于get、poet、put、delete等除了connect处理基本一致,所以处理首行,比如:
get http://www.a.com/ http/1.1
替换为
get / http/1.1
此时targethost也就是红色的部分,默认的请求80端口,此时port为80;如果targethost中有端口(比如www.a.com:8081),
就要分理处端口,此时port为8081。然后根据targethost和port连接到目标服务器target了,实现代码如下:
def gettargetinfo(self,host): #处理targethost获得网址和端口,作为返回值。
port=0
site=none
if ':' in host:
tmp=host.split(':')
site=tmp[0]
port=int(tmp[1])
else:
site=host
port=80
return site,port
def commonmethod(self,request): #处理除connect以外的方法
tmp=self.targethost.split('/')
net=tmp[0]+'//'+tmp[2]
request=request.replace(net,'') #替换掉首行不必要的部分
targetaddr=self.gettargetinfo(tmp[2]) #调用上面的函数
try:
(fam,_,_,_,addr)=socket.getaddrinfo(targetaddr[0],targetaddr[1])[0]
except exception as e:
print e
return
self.target=socket.socket(fam)
self.target.connect(addr) #连接到目标web服务
4、这一步就好办了,根据第三步处理后的request就可以self.target.send(request)发送给web服务器了。
5、这一步web服务器的reponse反响通过代理服务直接转发给客户端就行了,本人用了非阻塞select,可以试试epoll。
基本步骤就是这样,使用的方法函数可以改进,比如主函数部分使用的多线程或者多进程,怎样选择......
但是思路差不多都是这样啦。想测试的话,chrome安装switchysharp插件,设置一下,代理端口8083;
firefox插件autoproxy。
对于connect的处理还在解决中(如果有博友帮助就更好了),所以现在这个代理程序不支持https协议。
代理服务可以获得http协议的所有信息,想了解学习http,利用代理服务器是个不错的方法。
下面附上代码
#-*- coding: utf-8 -*-
import socket,select
import sys
import thread
from multiprocessing import process
class proxy:
def __init__(self,soc):
self.client,_=soc.accept()
self.target=none
self.request_url=none
self.bufsize=4096
self.method=none
self.targethost=none
def getclientrequest(self):
request=self.client.recv(self.bufsize)
if not request:
return none
cn=request.find('\n')
firstline=request[:cn]
print firstline[:len(firstline)-9]
line=firstline.split()
self.method=line[0]
self.targethost=line[1]
return request
def commonmethod(self,request):
tmp=self.targethost.split('/')
net=tmp[0]+'//'+tmp[2]
request=request.replace(net,'')
targetaddr=self.gettargetinfo(tmp[2])
try:
(fam,_,_,_,addr)=socket.getaddrinfo(targetaddr[0],targetaddr[1])[0]
except exception as e:
print e
return
self.target=socket.socket(fam)
self.target.connect(addr)
self.target.send(request)
self.nonblocking()
def connectmethod(self,request): #对于connect处理可以添加在这里
pass
def run(self):
request=self.getclientrequest()
if request:
if self.method in ['get','post','put',"delete",'have']:
self.commonmethod(request)
elif self.method=='connect':
self.connectmethod(request)
def nonblocking(self):
inputs=[self.client,self.target]
while true:
readable,writeable,errs=select.select(inputs,[],inputs,3)
if errs:
break
for soc in readable:
data=soc.recv(self.bufsize)
if data:
if soc is self.client:
self.target.send(data)
elif soc is self.target:
self.client.send(data)
else:
break
self.client.close()
self.target.close()
def gettargetinfo(self,host):
port=0
site=none
if ':' in host:
tmp=host.split(':')
site=tmp[0]
port=int(tmp[1])
else:
site=host
port=80
return site,port
if __name__=='__main__':
host = '127.0.0.1'
port = 8083
backlog = 5
server = socket.socket(socket.af_inet,socket.sock_stream)
server.setsockopt(socket.sol_socket,socket.so_reuseaddr,1)
server.bind((host,port))
server.listen(5)
while true:
thread.start_new_thread(proxy(server).run,())
# p=process(target=proxy(server).run, args=()) #多进程
# p.start()
发request给b代理,b代理再把request把送给c web服务,然后c的reponse->b->a。
要写web代理服务就要先了解下http协议,当然并不要多深入,除非要实现强大的功能:修改xx信息、
负载均衡等。http请求由三部分组成:请求行、消息报头、请求正文;
详细的网上有,想了解可以看看。下面是一个正常的get请求头(cookie部分本人没截屏,使用的系统w7):
可以看到首行:get是请求方法, /是路径,在后面是协议版本;第二行以后是请求报头,都是键值对形式;
get方法没有正文。post有正文,除此之外,请求方法头部基本一致,每一行结尾都是\r\n。
基本的请求方法,如下:
get 请求获取request-uri所标识的资源
post 在request-uri所标识的资源后附加新的数据
head 请求获取由request-uri所标识的资源的响应消息报头
put 请求服务器存储一个资源,并用request-uri作为其标识
delete 请求服务器删除request-uri所标识的资源
trace 请求服务器回送收到的请求信息,主要用于测试或诊断
connect 保留将来使用
options 请求查询服务器的性能,或者查询与资源相关的选项和需求
但是使用代理后,从代理服务上得到的请求如下:
与第一张图片对比一下,有什么不同......第一行的资源路径不对。当浏览器上设置代理请求时把整个url都作为资源路径了,所以我们要把域名删掉,然后代理服务器在把修改后的请求发送给目标
web服务器。就这么简单,当然connect方法特别,要特别对待,所以先说其他方法。
基本的思路:
1、代理服务器运行监听,当有客户端浏览器请求到来时通过accept()获得client句柄(或者叫描述符);
2、利用client描述符接收浏览器发来的request,分离出第一行为了修改第一行和获得method,
要去掉的的部分,除去http://的部分用targethost表示吧。
3、通过第2步能够获得方法method、request和targethost,这一步可以根据不同的method做不同的处理,
由于get、poet、put、delete等除了connect处理基本一致,所以处理首行,比如:
复制代码 代码如下:
get http://www.a.com/ http/1.1
替换为
get / http/1.1
此时targethost也就是红色的部分,默认的请求80端口,此时port为80;如果targethost中有端口(比如www.a.com:8081),
就要分理处端口,此时port为8081。然后根据targethost和port连接到目标服务器target了,实现代码如下:
复制代码 代码如下:
def gettargetinfo(self,host): #处理targethost获得网址和端口,作为返回值。
port=0
site=none
if ':' in host:
tmp=host.split(':')
site=tmp[0]
port=int(tmp[1])
else:
site=host
port=80
return site,port
def commonmethod(self,request): #处理除connect以外的方法
tmp=self.targethost.split('/')
net=tmp[0]+'//'+tmp[2]
request=request.replace(net,'') #替换掉首行不必要的部分
targetaddr=self.gettargetinfo(tmp[2]) #调用上面的函数
try:
(fam,_,_,_,addr)=socket.getaddrinfo(targetaddr[0],targetaddr[1])[0]
except exception as e:
print e
return
self.target=socket.socket(fam)
self.target.connect(addr) #连接到目标web服务
4、这一步就好办了,根据第三步处理后的request就可以self.target.send(request)发送给web服务器了。
5、这一步web服务器的reponse反响通过代理服务直接转发给客户端就行了,本人用了非阻塞select,可以试试epoll。
基本步骤就是这样,使用的方法函数可以改进,比如主函数部分使用的多线程或者多进程,怎样选择......
但是思路差不多都是这样啦。想测试的话,chrome安装switchysharp插件,设置一下,代理端口8083;
firefox插件autoproxy。
对于connect的处理还在解决中(如果有博友帮助就更好了),所以现在这个代理程序不支持https协议。
代理服务可以获得http协议的所有信息,想了解学习http,利用代理服务器是个不错的方法。
下面附上代码
复制代码 代码如下:
#-*- coding: utf-8 -*-
import socket,select
import sys
import thread
from multiprocessing import process
class proxy:
def __init__(self,soc):
self.client,_=soc.accept()
self.target=none
self.request_url=none
self.bufsize=4096
self.method=none
self.targethost=none
def getclientrequest(self):
request=self.client.recv(self.bufsize)
if not request:
return none
cn=request.find('\n')
firstline=request[:cn]
print firstline[:len(firstline)-9]
line=firstline.split()
self.method=line[0]
self.targethost=line[1]
return request
def commonmethod(self,request):
tmp=self.targethost.split('/')
net=tmp[0]+'//'+tmp[2]
request=request.replace(net,'')
targetaddr=self.gettargetinfo(tmp[2])
try:
(fam,_,_,_,addr)=socket.getaddrinfo(targetaddr[0],targetaddr[1])[0]
except exception as e:
print e
return
self.target=socket.socket(fam)
self.target.connect(addr)
self.target.send(request)
self.nonblocking()
def connectmethod(self,request): #对于connect处理可以添加在这里
pass
def run(self):
request=self.getclientrequest()
if request:
if self.method in ['get','post','put',"delete",'have']:
self.commonmethod(request)
elif self.method=='connect':
self.connectmethod(request)
def nonblocking(self):
inputs=[self.client,self.target]
while true:
readable,writeable,errs=select.select(inputs,[],inputs,3)
if errs:
break
for soc in readable:
data=soc.recv(self.bufsize)
if data:
if soc is self.client:
self.target.send(data)
elif soc is self.target:
self.client.send(data)
else:
break
self.client.close()
self.target.close()
def gettargetinfo(self,host):
port=0
site=none
if ':' in host:
tmp=host.split(':')
site=tmp[0]
port=int(tmp[1])
else:
site=host
port=80
return site,port
if __name__=='__main__':
host = '127.0.0.1'
port = 8083
backlog = 5
server = socket.socket(socket.af_inet,socket.sock_stream)
server.setsockopt(socket.sol_socket,socket.so_reuseaddr,1)
server.bind((host,port))
server.listen(5)
while true:
thread.start_new_thread(proxy(server).run,())
# p=process(target=proxy(server).run, args=()) #多进程
# p.start()
上一篇: 吃面包的时候需要特意选择易消化的面包吗