欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Java 获取Html文本中的img标签下src中的内容方法

程序员文章站 2023-12-19 19:46:46
如下所示: /** * 得到网页中图片的地址 * @param sets html字符串 */ public set

如下所示:

/**
  * 得到网页中图片的地址
  * @param sets html字符串
  */
 public set<string> getimgstr(string htmlstr) {
  set<string> pics = new hashset<string>();
  string img = "";
  pattern p_image;
  matcher m_image;
  string regex_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>";
  p_image = pattern.compile(regex_img, pattern.case_insensitive);
  m_image = p_image.matcher(htmlstr);
  while (m_image.find()) {
   // 得到<img />数据
   img = m_image.group();
   // 匹配<img>中的src数据
   matcher m = pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
   while (m.find()) {
    pics.add(m.group(1));
   }
  }
  return pics;
 }

以上这篇java 获取html文本中的img标签下src中的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。

上一篇:

下一篇: