欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

pands模块的妙用爬取网页中的表格

程序员文章站 2023-08-29 17:06:45
拿我这篇为例 主要就是处理一些特别的网站, "pands用法点我" ......

拿我这篇为例https://www.cnblogs.com/pythonywy/p/11574340.html

import pandas as  pd

df = pd.read_html('https://www.cnblogs.com/pythonywy/p/11574340.html')
print(df)
'''[             设备 rpx换算px (屏幕宽度/750) px换算rpx (750/屏幕宽度)
0       iphone5      1rpx = 0.42px      1px = 2.34rpx
1       iphone6       1rpx = 0.5px         1px = 2rpx
2  iphone6 plus     1rpx = 0.552px      1px = 1.81rpx,                 选择器              样例                             样例描述
0            .class          .intro         选择所有拥有 class="intro" 的组件
1               #id      #firstname          选择拥有 id="firstname" 的组件
2           element            view                     选择所有 view 组件
3  element, element  view, checkbox  选择所有文档的 view 组件和所有的 checkbox 组件
4           ::after     view::after                  在 view 组件后边插入内容
5          ::before    view::before                  在 view 组件前边插入内容]
'''

主要就是处理一些特别的网站,