爬虫爬取国内肯德基门店信息

程序员文章站 2022-09-14 13:13:22

预期效果爬取每个城市（300+城市）所有的肯德基门店信息，保存到excel中，效果如下：代码实现import requestsimport csvimport jsondef getData(page,key): url='http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword' headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x6...

预期效果

爬取每个城市（300+城市）所有的肯德基门店信息，保存到excel中，效果如下：
爬虫爬取国内肯德基门店信息

代码实现

import requests
import csv
import json

def getData(page,key):
    url='http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword'
    headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.79 Safari/537.36'}
    data={
    'cname':'',
    'pid':'',
    'keyword': key,
    'pageIndex': page,
    'pageSize': '10'
    }
    res=requests.post(url=url,data=data,headers=headers)
    json_data=res.json()
    print(json_data)
    count=json_data['Table'][0]['rowcount']
    for i in json_data['Table1']:
        storeName=i['storeName']
        cityName=i['cityName']
        addressDetail=i['addressDetail']
        pro=i['pro']
        print([storeName, cityName,addressDetail,pro])
        with open('kfc_store.csv', mode='a', newline='') as f:
            writer = csv.writer(f, delimiter=',')
            writer.writerow([key,storeName, cityName,addressDetail,pro])


if __name__=='__main__':
    # 从拉勾网上爬取全国各地城市，复制粘贴网页内容到txt文件再，接口如下。
    # URL='https://www.lagou.com/lbs/getAllCitySearchLabels.json'
    f2 = open('ci.txt', encoding='utf-8')
    ts = f2.readline()
    print(ts)
    json_ts = json.loads(ts)
    cs = json_ts['content']['data']['allCitySearchLabels']
    place = []
    m = 0
    for c in cs:
        for i in cs[c]:
            m = m + 1
            place.append(i['name'])
    print(f'一共有{m}个城市')
    print(place)

    # place=['北京','上海','广州','深圳']
    for key in place:
        url = 'http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword'
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.79 Safari/537.36'}
        data = {
            'cname': '',
            'pid': '',
            'keyword': key,
            'pageIndex': 1,
            'pageSize': '10'
        }
        res = requests.post(url=url, data=data, headers=headers)
        json_data = res.json()
        # print(json_data)
        count = json_data['Table'][0]['rowcount']
        c = count // 10 + 2
        for n in range(1,c):
            print(f'===========正在获取{key}数据===========')
            print('===========正在获取第{}页数据==========='.format(n))
            getData(n,key)

本文地址：https://blog.csdn.net/weixin_43636302/article/details/107180944

上一篇：打造性感纤细脖子,帮你练就完美颈部线条

下一篇：如何做一个从外到内都美丽的女人？女性健康美丽吃出来

爬虫爬取国内肯德基门店信息

预期效果

代码实现

Python爬虫实战用 BeautifulSoup 爬取电影网站信息

我的第一个爬虫，爬取北京地区短租房信息

Python爬虫使用selenium爬取qq群的成员信息（全自动实现自动登陆）

网易云歌单信息爬取及数据分析（python爬虫）

Python爬虫实例：爬取B站《工作细胞》短评——异步加载信息的爬取

Python爬虫实战用 BeautifulSoup 爬取电影网站信息

Python爬虫项目，爬取豆瓣top250中影片信息

python网络爬虫之解析网页的XPath(爬取Path职位信息)[三]

一个简单的python爬虫程序爬取豆瓣热度Top100以内的电影信息

python爬虫_微信公众号推送信息爬取的实例

爬虫爬取国内肯德基门店信息

预期效果

代码实现

Python爬虫实战用 BeautifulSoup 爬取电影网站信息

我的第一个爬虫，爬取北京地区短租房信息

Python爬虫使用selenium爬取qq群的成员信息（全自动实现自动登陆）

网易云歌单信息爬取及数据分析（python爬虫）

Python爬虫实例：爬取B站《工作细胞》短评——异步加载信息的爬取

Python爬虫实战用 BeautifulSoup 爬取电影网站信息

Python爬虫项目 ，爬取豆瓣top250中影片信息

python网络爬虫之解析网页的XPath(爬取Path职位信息)[三]

一个简单的python爬虫程序 爬取豆瓣热度Top100以内的电影信息

python爬虫_微信公众号推送信息爬取的实例

Python爬虫项目，爬取豆瓣top250中影片信息

一个简单的python爬虫程序爬取豆瓣热度Top100以内的电影信息