欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

PHP正则表达式提取超链接及其标题_PHP教程

程序员文章站 2024-01-09 15:34:22
...
有这么一段HTML,比较不规则的,如果要提取其中的链接地址和链接名称,怎么弄?

';
以下为引用的内容:
//HTML
$str = '歌曲列表
中文金曲榜
轻音乐


利用正则表达式是最简单的,其它的办法,偶米去想。。。

以下为引用的内容:
$pat = '/(.*?)/i';
preg_match_all($pat, $str, $m);


输出方法:

以下为引用的内容:
print_r($m[2]);
print_r($m[4]);


或者:
以下为引用的内容:
for($i=0;$iecho '
  • '.$m[4][$i].'';
    }


  • 显示结果是:

    以下为引用的内容:
    Array ( [0] => http://list.mp3.baidu.com/song/A.htm?top8 [1] => http://list.mp3.baidu.com/list/bangping.html [2] => qingyinyue.html?top19 ) Array ( [0] => 歌曲列表 [1] => 中文金曲榜 [2] => 轻音乐 )


    于是,我们要采集某个网站的标题及链接地址方法就出来了。。。自己套用吧。。。

    www.bkjia.comtruehttp://www.bkjia.com/PHPjc/363975.htmlTechArticle有这么一段HTML,比较不规则的,如果要提取其中的链接地址和链接名称,怎么弄? 以下为引用的内容: //HTML $str = 'a id=top8 href=http://list.m...