【爬虫】元素定位(xpath、css)
程序员文章站
2022-06-23 11:22:34
1.xpath选择表达式说明举例nodeName按节点名选取form,选取form节点/从根节点选取(绝对路径)/html/body/form/input,选取input节点//从任意节点选取(相对路径)//form/input,选取input节点form//input,选择form元素的后代的所有 input 元素@元素属性//form/input[@name],选取带有name属性的input节点;//input[@name=‘username’...
1.xpath选择
表达式 | 说明 | 举例 |
---|---|---|
nodeName | 按节点名选取 | form,选取form节点 |
/ | 从根节点选取(绝对路径) | /html/body/form/input,选取input节点 |
// | 从任意节点选取(相对路径) | //form/input,选取input节点 form//input,选择form元素的后代的所有 input 元素 |
@ | 元素属性 | //form/input[@name],选取带有name属性的input节点; //input[@name=‘username’] ,选取所有name属性为username的input节点; //input[@*]选择有任何属性的input节点 |
. | 选取当前节点 | |
.. | 选取父节点 | //input/.. |
[ ] | 如果有多个元素,可以进行筛选 | /form/input[1],选择第一个元素 /form/input[2],选择第2个元素 /form/input[last()],选择最后一个元素 /form/input[last()-1],选择倒数第二个元素 |
* | 选择任何节点 | /form/*,选择form之后的所有节点 |
| | 或者 | //form | //a,选择所有的input和a节点 |
2.css选择
表达式 | 说明 | 举例 |
---|---|---|
#id | 通过id选择元素 | #username,选择id为username的元素 |
.class | 通过类选择元素 | .container ,选择class为container的元素 |
element | 通过元素名选择元素 | input,选择所有input元素 |
[attribute] | 通过属性选择元素,选择具有attribute属性的元素 | |
[attribute=value] | 通过属性选择元素 | [type=“password”],选择type属性为password的元素 |
a:link,a:visited | 选择未被访问、已被访问过的元素 | |
p:empty | 选择没有子元素的p元素 |
本文地址:https://blog.csdn.net/qq_39147299/article/details/109263051