正则表达式,提取网页中的链接地址
程序员文章站
2022-07-02 19:35:27
<td class=cate width="45%" style="word-break:break-all">
<a class=m href="http://jmfengcai.cn.alibaba.com/athena/companydetail/jmfengcai.html" onmousedown="return aliclick(this,'?alishop=companylistcompanyname');" target="_blank" class=m>江门市蓬江区凤彩工艺厂</a>
<br>
代码如上.我请问如何用正则表达式,把"http://jmfengcai.cn.alibaba.com/athena/companydetail/jmfengcai.html"提取出来?
/(http:\/\/\[^" ']+)/gm
/href *= *['"]*(\s+)["']* */gm
根据不同需要选择。
<a class=m href="http://jmfengcai.cn.alibaba.com/athena/companydetail/jmfengcai.html" onmousedown="return aliclick(this,'?alishop=companylistcompanyname');" target="_blank" class=m>江门市蓬江区凤彩工艺厂</a>
<br>
代码如上.我请问如何用正则表达式,把"http://jmfengcai.cn.alibaba.com/athena/companydetail/jmfengcai.html"提取出来?
复制代码 代码如下:
/(http:\/\/\[^" ']+)/gm
/href *= *['"]*(\s+)["']* */gm
根据不同需要选择。
上一篇: 过滤所有HTML代码和CSS,JS
下一篇: AI发展格局正从“数据”演变为“知识”