采集正则 求大神解答
程序员文章站
2022-03-20 11:44:15
...
新品专区
保暖上装
-
假两件(衬衫领)
-
V领上装
上面是分类 我匹配的一级分类
$dafht='#
(.*)
#iUs';preg_match_all($dafht, $fenlei, $dafenlei);
但是无效 求大神解答
一级分类主要是采集 category-907362761.htm 这个数字ID 和后面的名称
二级分类采集 category-907362761.htm parentCatId=907362759 这俩个数字ID 和后面的名称
怎么写 卡主半天了 求解答
回复讨论(解决方案)
一级分类:/
.*?/isU,没测试,不知道能不能匹配到
二级分类看不太清楚
为什么费神写这个?人家网站稍有变化,功夫就白费了
网上有很多简捷实用的工具,为什么不用呢?
比如这个
$s = 新品专区
保暖上装
-
假两件(衬衫领)
-
V领上装
TXT;include 'simple_html_dom.php';$p = new simple_html_dom;$p->load($s);foreach($p->find('a') as $v) { echo $v->class, PHP_EOL; //这是可供区分级别的 class echo $v->href,PHP_EOL; //这是url echo trim($v->innertext()),PHP_EOL; //这是说明文字}
cat-name fst-cat-name http://bosidengny.tmall.com/category-907362758.htm?search=y&catName=%D0%C2%C6%B7%D7%A8%C7%F8新品专区 cat-name fst-cat-namehttp://bosidengny.tmall.com/category-907362759.htm?search=y&catName=%B1%A3%C5%AF%C9%CF%D7%B0保暖上装cat-name snd-cat-namehttp://bosidengny.tmall.com/category-907362760.htm?search=y&parentCatId=907362759&parentCatName=%B1%A3%C5%AF%C9%CF%D7%B0&catName=%BC%D9%C1%BD%BC%FE%A3%A8%B3%C4%C9%C0%C1%EC%A3%A9假两件(衬衫领)cat-name snd-cat-namehttp://bosidengny.tmall.com/category-907362761.htm?search=y&parentCatId=907362759&parentCatName=%B1%A3%C5%AF%C9%CF%D7%B0&catName=V%C1%EC%C9%CF%D7%B0V领上装
声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。
相关文章
相关视频
专题推荐
-
独孤九贱-php全栈开发教程
全栈 170W+
主讲:Peter-Zhu 轻松幽默、简短易学,非常适合PHP学习入门
-
玉女心经-web前端开发教程
入门 80W+
主讲:灭绝师太 由浅入深、明快简洁,非常适合前端学习入门
-
天龙八部-实战开发教程
实战 120W+
主讲:西门大官人 思路清晰、严谨规范,适合有一定web编程基础学习
- 最新文章
- 热门排行
网友评论
文明上网理性发言,请遵守 新闻评论服务协议
我要评论