Python urlopen 使用小示例
程序员文章站
2022-04-27 10:35:28
一、打开一个网页获取所有的内容
from urllib import urlopendoc = urlopen("http://www.baidu.com").read(...
一、打开一个网页获取所有的内容
from urllib import urlopen
doc = urlopen("http://www.baidu.com").read()
print doc
doc = urlopen("http://www.baidu.com").read()
print doc
二、获取http头
from urllib import urlopen
doc = urlopen("http://www.baidu.com")
print doc.info()
print doc.info().getheader('content-type')
doc = urlopen("http://www.baidu.com")
print doc.info()
print doc.info().getheader('content-type')
三、使用代理
1. 查看环境变量
print ""n".join(["%s=%s" % (k, v) for k, v in os.environ.items()])
print os.getenv("http_proxy")
print os.getenv("http_proxy")
2. 设置环境变量
import os
os.putenv("http_proxy", "http://proxyaddr:<port>")
os.putenv("http_proxy", "http://proxyaddr:<port>")
3. 使用代理
# use http://www.someproxy.com:3128 for http proxying
proxies = {'http': 'http://www.someproxy.com:3128'}
filehandle = urllib.urlopen(some_url, proxies=proxies)
# don't use any proxies
filehandle = urllib.urlopen(some_url, proxies={})
# use proxies from environment - both versions are equivalent
filehandle = urllib.urlopen(some_url, proxies=none)
filehandle = urllib.urlopen(some_url)
proxies = {'http': 'http://www.someproxy.com:3128'}
filehandle = urllib.urlopen(some_url, proxies=proxies)
# don't use any proxies
filehandle = urllib.urlopen(some_url, proxies={})
# use proxies from environment - both versions are equivalent
filehandle = urllib.urlopen(some_url, proxies=none)
filehandle = urllib.urlopen(some_url)
上一篇: 扫不出肉鸡的常见原因
下一篇: 途牛的服务器部署及架构演进的经验总结