欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

采撷正则 求大神解答

程序员文章站 2022-04-29 14:40:11
...
采集正则 求大神解答





href="http://bosidengny.tmall.com/category-907362758.htm?search=y&catName=%D0%C2%C6%B7%D7%A8%C7%F8"
>新品专区








  • href="http://bosidengny.tmall.com/category-907362759.htm?search=y&catName=%B1%A3%C5%AF%C9%CF%D7%B0"
    >保暖上装








    • href="http://bosidengny.tmall.com/category-907362760.htm?search=y&parentCatId=907362759&parentCatName=%B1%A3%C5%AF%C9%CF%D7%B0&catName=%BC%D9%C1%BD%BC%FE%A3%A8%B3%C4%C9%C0%C1%EC%A3%A9"
      >
      假两件(衬衫领)






    • href="http://bosidengny.tmall.com/category-907362761.htm?search=y&parentCatId=907362759&parentCatName=%B1%A3%C5%AF%C9%CF%D7%B0&catName=V%C1%EC%C9%CF%D7%B0"
      >
      V领上装





    • 上面是分类 我匹配的一级分类
      $dafht='#

      (.*)

      #iUs';
      preg_match_all($dafht, $fenlei, $dafenlei);

      但是无效 求大神解答


      一级分类主要是采集 category-907362761.htm 这个数字ID 和后面的名称

      二级分类采集 category-907362761.htm parentCatId=907362759 这俩个数字ID 和后面的名称

      怎么写 卡主半天了 求解答








      ------解决思路----------------------
      为什么费神写这个?人家网站稍有变化,功夫就白费了
      网上有很多简捷实用的工具,为什么不用呢?
      比如这个
    $s =





    href="http://bosidengny.tmall.com/category-907362758.htm?search=y&catName=%D0%C2%C6%B7%D7%A8%C7%F8"
    >新品专区








  • href="http://bosidengny.tmall.com/category-907362759.htm?search=y&catName=%B1%A3%C5%AF%C9%CF%D7%B0"
    >保暖上装








    • href="http://bosidengny.tmall.com/category-907362760.htm?search=y&parentCatId=907362759&parentCatName=%B1%A3%C5%AF%C9%CF%D7%B0&catName=%BC%D9%C1%BD%BC%FE%A3%A8%B3%C4%C9%C0%C1%EC%A3%A9"
      >
      假两件(衬衫领)






    • href="http://bosidengny.tmall.com/category-907362761.htm?search=y&parentCatId=907362759&parentCatName=%B1%A3%C5%AF%C9%CF%D7%B0&catName=V%C1%EC%C9%CF%D7%B0"
      >
      V领上装



    • TXT;

      include 'simple_html_dom.php';
      $p = new simple_html_dom;
      $p->load($s);
      foreach($p->find('a') as $v) {
      echo $v->class, PHP_EOL; //这是可供区分级别的 class
      echo $v->href,PHP_EOL; //这是url
      echo trim($v->innertext()),PHP_EOL; //这是说明文字
      }
    cat-name fst-cat-name 
    http://bosidengny.tmall.com/category-907362758.htm?search=y&catName=%D0%C2%C6%B7%D7%A8%C7%F8
    新品专区
    cat-name fst-cat-name
    http://bosidengny.tmall.com/category-907362759.htm?search=y&catName=%B1%A3%C5%AF%C9%CF%D7%B0
    保暖上装
    cat-name snd-cat-name
    http://bosidengny.tmall.com/category-907362760.htm?search=y&parentCatId=907362759&parentCatName=%B1%A3%C5%AF%C9%CF%D7%B0&catName=%BC%D9%C1%BD%BC%FE%A3%A8%B3%C4%C9%C0%C1%EC%A3%A9
    假两件(衬衫领)
    cat-name snd-cat-name
    http://bosidengny.tmall.com/category-907362761.htm?search=y&parentCatId=907362759&parentCatName=%B1%A3%C5%AF%C9%CF%D7%B0&catName=V%C1%EC%C9%CF%D7%B0
    V领上装
    采撷正则 求大神解答

    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。

    相关文章

    相关视频


    网友评论

    文明上网理性发言,请遵守 新闻评论服务协议

    我要评论
  • 采撷正则 求大神解答
  • 专题推荐

    作者信息
    采撷正则 求大神解答

    认证0级讲师

    推荐视频教程
  • 采撷正则 求大神解答javascript初级视频教程
  • 采撷正则 求大神解答jquery 基础视频教程
  • 视频教程分类
    相关标签: nbsp cat class gt lt

    上一篇: MySQL rpl_semi_sync_master_timeout相关的一件BUG_PHP教程

    下一篇: JAVA:JUnit 单元测试

    推荐阅读