欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

python获取糗百图片代码实例

程序员文章站 2024-02-03 12:40:04
复制代码 代码如下:from sgmllib import sgmlparserimport urllib2 class sgm(sgmlparser): &n...

复制代码 代码如下:

from sgmllib import sgmlparser
import urllib2

class sgm(sgmlparser):
    def reset(self):
        sgmlparser.reset(self)
        self.srcs=[]
        self.istrue=true

    def start_div(self,artts):
        for k,v in artts:
            if v=="author":
                self.istrue=false
    def end_div(self):
        self.istrue=true
    def start_img(self,artts):
        for k,v in artts:
            if k=="src" and self.istrue==true:
                self.srcs.append(v)

    def download(self):
        for src in self.srcs:
            f=open(src[-12:],"wb")
            print src
            img=urllib2.urlopen(src)
            f.write(img.read())
            f.close()
sgm=sgm()
for page in range(1,500):
    url="http://www.qiushibaike.com/late/page/%s?s=4622726" % page
    data=urllib2.urlopen(url).read()
    sgm.feed(data)
    sgm.download()