欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

proxyme——java NIO实现的http代理,支持https

程序员文章站 2022-04-23 11:58:39
...

proxyme 一个http代理

使用java NIO的http代理。支持https。建议不要再chrome上使用本代理,因为chrome本身会请求很多谷歌的api,结果被墙住了,又只有两个线程,导致其他都被阻塞,很尴尬。

之前也打算做过这个东西,结果做出来的有点缺陷(现在想可能是selector中锁的问题,忘记了)。这大概隔了半年,这个项目的http代理功能实现了。

源码地址

https://github.com/arloor/proxyme

运行日志

11:23:08.883 [main] INFO com.arloor.proxyme.HttpProxyBootStrap - 在8080端口启动了代理服务
11:23:12.208 [localSelector] INFO com.arloor.proxyme.LocalSelector - 接收浏览器连接: /127.0.0.1:50317
11:23:12.210 [localSelector] INFO com.arloor.proxyme.ChannalBridge - 请求—— CONNECT cn.bing.com:443 HTTP/1.1
11:23:12.291 [localSelector] INFO com.arloor.proxyme.ChannalBridge - 创建远程连接: cn.bing.com/202.89.233.100:443
11:23:12.291 [remoteSlector] INFO com.arloor.proxyme.RemoteSelector - 注册remoteChannel到remoteSelector。remoteChannel: cn.bing.com/202.89.233.100:443
11:23:12.298 [localSelector] INFO com.arloor.proxyme.ChannalBridge - 发送请求517 -->cn.bing.com/202.89.233.100:443
11:23:12.365 [remoteSlector] INFO com.arloor.proxyme.ChannalBridge - 接收响应2720 <--cn.bing.com/202.89.233.100:443
11:23:12.365 [remoteSlector] INFO com.arloor.proxyme.ChannalBridge - 接收响应1360 <--cn.bing.com/202.89.233.100:443
11:23:12.366 [remoteSlector] INFO com.arloor.proxyme.ChannalBridge - 接收响应1360 <--cn.bing.com/202.89.233.100:443
11:23:12.369 [remoteSlector] INFO com.arloor.proxyme.ChannalBridge - 接收响应1360 <--cn.bing.com/202.89.233.100:443
11:23:12.369 [remoteSlector] INFO com.arloor.proxyme.ChannalBridge - 接收响应1 <--cn.bing.com/202.89.233.100:443
11:23:12.378 [localSelector] INFO com.arloor.proxyme.ChannalBridge - 发送请求93 -->cn.bing.com/202.89.233.100:443
11:23:12.382 [localSelector] INFO com.arloor.proxyme.ChannalBridge - 发送请求1022 -->cn.bing.com/202.89.233.100:443
...
...
11:23:13.281 [localSelector] INFO com.arloor.proxyme.LocalSelector - 接收浏览器连接: /127.0.0.1:50319
11:23:13.282 [localSelector] INFO com.arloor.proxyme.ChannalBridge - 请求—— GET http://s.cn.bing.net/th?id=OSA.xiipvhS2Pp2bEg&w=80&h=80&c=8&rs=1&pid=SatAns HTTP/1.1
11:23:13.382 [localSelector] INFO com.arloor.proxyme.ChannalBridge - 创建远程连接: s.cn.bing.net/112.84.133.11:80
11:23:13.383 [remoteSlector] INFO com.arloor.proxyme.RemoteSelector - 注册remoteChannel到remoteSelector。remoteChannel: s.cn.bing.net/112.84.133.11:80
11:23:13.383 [localSelector] INFO com.arloor.proxyme.ChannalBridge - 发送请求340 -->s.cn.bing.net/112.84.133.11:80
11:23:13.383 [localSelector] INFO com.arloor.proxyme.ChannalBridge - 发送请求409 -->s.cn.bing.net/112.84.133.11:80

性能与内存

占用cpu不到1%

内存最大35m(不含jvm自身)。GC次数和时间很少

总的来说,性能可以了吧。

思路

两个线程,每个线程一个selector。

localSelector线程,负责接收本地浏览器的连接请求和读写浏览器到代理的socketChannel

remoteSelector线程,负责读写web服务器到代理的socketChannel。

ChannelBridge类,持有localSocketChannel和remoteSocketChannel。职责是处理请求和响应,并转发。

RequestHeader类,职责是格式化请求行和请求头。

实现中的注意点

首先是健壮性!每一个try块都是很重要的!都解决了一个问题

其次是锁的问题:

selector.select()会占有锁,channel.register(selector)需要持有同样的锁。

如果调用上面的两个方法的语句在两个线程中,会让channel.regiter等很久很久,导致响应难以及时得到。

而在实现中,这是一个生产者消费者问题。localSelector线程根据本地浏览器请求产生了一个从代理到web服务器的remoteChannel。而remoteSelector要接收这个remoteChannel,这也就是消费了。

很自然的,避免上面锁等待最好的方法:localSelector生成remoteChannel,将其放入队列。remoteSelector线程从队列中取。再结合selector.wakeup()使其从阻塞中返回,可以快速地接收(register)这个remoteChannel。

这两点,就是最最重要的两点了。

另外还有,因为代理而需要改变的请求头了,参见com.arloor.proxyme.RequestHeader.reform()方法。

最后,https代理实现中的坑。http代理传输的内容是明文,字节肯定大于0,而https传输的字节可能小于0。因为这个,传输https数据的bybebuff时,要特意指定bytebuff的limit为实际大小。

还有一个小问题,向remoteChannel 写的时候,有时候会写0个字节,原因是底层tcp缓冲满了,我的处理是等0.1秒,再继续传。当然设置OP_WRITE这个监听选项的目的就是处理这种情况。

http代理不神秘。

可以改进的地方

对channel的读写可以加入更多的线程来进行。

相关标签: http