Java 获取Html文本中的img标签下src中的内容方法
程序员文章站
2023-12-19 19:46:46
如下所示:
/**
* 得到网页中图片的地址
* @param sets html字符串
*/
public set
如下所示:
/** * 得到网页中图片的地址 * @param sets html字符串 */ public set<string> getimgstr(string htmlstr) { set<string> pics = new hashset<string>(); string img = ""; pattern p_image; matcher m_image; string regex_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>"; p_image = pattern.compile(regex_img, pattern.case_insensitive); m_image = p_image.matcher(htmlstr); while (m_image.find()) { // 得到<img />数据 img = m_image.group(); // 匹配<img>中的src数据 matcher m = pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img); while (m.find()) { pics.add(m.group(1)); } } return pics; }
以上这篇java 获取html文本中的img标签下src中的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。