python爬虫第一天——入门

程序员文章站 2022-04-08 23:20:33

...

python爬虫第一天——入门

看过python基础知识,想学点好玩的知识,于是就想起来了爬虫.

下面是照着书上敲的第一个爬虫程序

利用requests.get()模拟get请求获取response对象
再利用BeatifulSoup进行解析
最后保存文件

import requests
from bs4 import BeautifulSoup
def main():
    #定义目标网页地址
    link = "http://www.santostang.com/"
    #定义请求头信息
    headers={'User-Agent' : 'Mozilla/5.0 (Window; U; Windows NT 6.1; en-Us; rv:1.9.1.6) Gecko/200912.1 Firefox/3.5.6'}
    r =requests.get(link,headers=headers) #请求网页

    soup=BeautifulSoup(r.text,"html.parser")#使用beautifulSoup解析
    title=soup.find("h1",class_="post-title").a.text.strip()
    print(title)

    filename = "CrawlerDemo.txt"
    outfile = open(filename,"w")
    outfile.write(title)
    outfile.close()
main()

相关标签： Python 爬虫 python爬虫

上一篇：爬虫系列（四）--全站爬取

下一篇： SwiftUI 实战之导航条切换到下一个页面后隐藏NavigationView和NavigationLink

python爬虫第一天——入门

python爬虫第一天——入门

Python制作爬虫采集小说

python制作最美应用的爬虫

python制作花瓣网美女图片爬虫

Python入门篇之函数

Python入门篇之面向对象

使用Python开发windows GUI程序入门实例

简单的Python抓taobao图片爬虫

Python爬虫实现爬取百度百科词条功能实例

Python入门之三角函数全解【收藏】

Python入门之三角函数tan()函数实例详解