python爬虫 - 爬取智联招聘

程序员文章站 2022-05-09 17:45:30

...

import urllib.request
import urllib.parse
from Bs4 import BeautifulSoup
import lxml

def main():

    url = 'https://sou.zhaopin.com/jobs/searchresult.ashx?'

    jl = input('请输入工作地点：')
    kw = input('请输入工作关键字：')
    start_page = int(input('请输入起始页码：'))
    end_page = int(input('请输入结束页码：'))
    for page in range(start_page, end_page+1):
        data = {
            'jl':jl,
            'kw':kw,
            'p':page,
        }
        url_now = url + urllib.parse.urlencode(data)
        print(url_now)
        header = {'User-Agent': ' Mozilla/5.0 (Windows NT 6.1; Win64;'
                                ' x64) AppleWebKit/537.36 (KHTML, like'
                                ' Gecko) Chrome/71.0.3578.98 Safari/537.36', }
        request = urllib.request.Request(url=url_now, headers=header)
        response = urllib.request.urlopen(request)
        #print(response)
        soup = BeautifulSoup(response.read().decode('utf8'), 'lxml')
        print(soup.find('a',href='http://company.zhaopin.com/CZ000100000.htm'))
        #print(type(info))
        #for div in div_list:
        #    zwmc = div.span['title']
        #    print(zwmc)
        #    exit()

if __name__ == '__main__':
    main()

python爬虫 - 爬取智联招聘

详解用python写网络爬虫-爬取新浪微博评论

Python实现爬取知乎神回复简单爬虫代码分享

Python网络爬虫（selenium爬取动态网页、爬虫案例分析、哈希算法与RSA加密）

Python爬虫实战用 BeautifulSoup 爬取电影网站信息

python爬虫爬取奇书阁首页分类小说数据

python爬虫爬取豆瓣top排行图片

利用python爬虫爬取斗鱼图片(简单详细)

python面向对象多线程爬虫爬取搜狐页面的实例代码

python爬虫教程：《利用Python爬取表情包》

Python爬虫实例爬取网站搞笑段子