python赶集网bs4爬取内容

程序员文章站 2022-10-03 13:13:56

import requests,csvfrom bs4 import BeautifulSouplist=[]herders={“User-Agent”:“Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Mobile Safari/537.36” }url=“http://bj.ganji.com/zufang/f4/p...

下面展示一些 内联代码片。

// A code block
var foo = 'bar';

// An highlighted block
import requests,csv
from bs4 import BeautifulSoup
list=[]
herders={"User-Agent":"Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Mobile Safari/537.36" }
url="http://bj.ganji.com/zufang/f4/pnl/"
r=requests.get(url,headers=herders).text
soup=BeautifulSoup(r,'lxml')
div=soup.find('div',class_='f-list js-tips-list').find_all("dl",class_="f-list-item-wrap min-line-height f-clear")
for i in div:
    name=i.find("dd",class_="dd-item title").a.string
    struct=i.find("dd",class_="dd-item size").span.text
    price=i.find("dd",class_="dd-item info").find("span",class_="num").string
    list.append([name,struct,price])
with open("赶集网.csv","w+",encoding="utf-8",newline="") as f:
    w=csv.writer(f)
    w.writerows(list)

本文地址：https://blog.csdn.net/sober_1/article/details/109640200

上一篇：唐朝时期的军事实力到底有多强大呢？

下一篇：古代爱情故事之一：苏轼生命中的三个女人分别是谁？

python赶集网bs4爬取内容

通过抓取淘宝评论为例讲解Python爬取ajax动态生成的数据(经典)

python爬取网页内容转换为PDF文件

Python使用Selenium爬取淘宝异步加载的数据方法

网易云歌单信息爬取及数据分析（python爬虫）

python爬取个性签名的方法

python如何爬取个性签名

Python实现爬取马云的微博功能示例

Python爬取Coursera课程资源的详细过程

Python实现爬取知乎神回复简单爬虫代码分享

Python 爬取陈都灵百度图片