欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python中使用urllib2防止302跳转的代码例子

程序员文章站 2023-12-02 08:09:34
说明:python的urllib2获取网页(urlopen)会自动重定向(301,302)。但是,有时候我们需要获取302,301页面的状态信息。就必须获取到转向前的调试信...

说明:python的urllib2获取网页(urlopen)会自动重定向(301,302)。但是,有时候我们需要获取302,301页面的状态信息。就必须获取到转向前的调试信息。

下面代码将可以做到避免302重定向到新的网页

#!/usr/bin/python
# -*- coding: utf-8 -*-
#encoding=utf-8
#filename:states_code.py
 
import urllib2
 
class redircthandler(urllib2.httpredirecthandler):
  """docstring for redircthandler"""
  def http_error_301(self, req, fp, code, msg, headers):
    pass
  def http_error_302(self, req, fp, code, msg, headers):
    pass
 
def getunredirecturl(url,timeout=10):
  req = urllib2.request(url)
  debug_handler = urllib2.httphandler(debuglevel = 1)
  opener = urllib2.build_opener(debug_handler, redircthandler)
 
  html = none
  response = none
  try:
    response = opener.open(url,timeout=timeout)
    html = response.read()
  except urllib2.urlerror as e:
    if hasattr(e, 'code'):
      error_info = e.code
    elif hasattr(e, 'reason'):
      error_info = e.reason
  finally:
    if response:
      response.close()
  if html:
    return html
  else:
    return error_info
 
html = getunredirecturl('http://jb51.net')
print html