欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python爬虫学习

程序员文章站 2022-06-21 23:39:17
Python爬虫学习遇到的小问题1.如何处理当遇到url里面有需要动态更新的内容(如页码变动)?需要使用url格式化拼接:#page_num写在for循环里面,每次需要更新page_num +=1url = “https://www.baidu.com/%d”new_url = format(url % page_num)2.使用fp.write()写入内容时,返回空文件?原因:写入文件后未关闭文件!需要在结尾处加上fp.close()#这是爬取58二手房源的那个例子fp = open...

Python爬虫学习遇到的小问题

1.如何处理当遇到url里面有需要动态更新的内容(如页码变动)?

需要使用url格式化拼接:

#page_num写在for循环里面,每次需要更新
page_num +=1
url = “https://www.baidu.com/%d”
new_url = format(url % page_num)

2.使用fp.write()写入内容时,返回空文件?

原因:写入文件后未关闭文件!需要在结尾处加上fp.close()

#这是爬取58二手房源的那个例子
fp = open('58二手房源xa.txt','w',encoding='utf-8')
for li in li_list:
    title = li.xpath(".//h2[@class='title']/a/text()")[0]
    house_num +=1
    fp.write(str(house_num)+'.'+title+'\n'')
fp.close()

其中,有两点需要注意:
(1)fp.close()跟for循环在同一级
(2)由于house_num是int类型,不能进行字符串拼接,所以要使用str(house_num)转换类型!

本文地址:https://blog.csdn.net/lin0cp/article/details/110427341

相关标签: python爬虫 python