php正则匹配图片路径原理与方法

程序员文章站 2022-06-06 13:16:15

...

下面我来给大家介绍在php正则匹配图片路径原理与实现方法，有需要了解的朋友可进入参考参考。

提取src=里面的图片地址还不足够，因为不能保证那个地址一定是绝对地址，完全的地址，如果那是相对的呢？如果地址诸如：
albums/Candids/thumb_P1050338.jpg
/content/media/touts/5271608/5271654/15320982
那该如何是好？
有时在这些地址前面需要加http://example1.com/ ，有些甚至要加http://example1.com/example2/.../ 于是，要写出出一种法则符合所有要求，简直是天方夜谭。只能见机行事对症下药。有时，需要从前面动刀，有时需要从后面砍断。
今天，我惊讶地知道了一个道理，原来http://example.com/ 和http://example.com////// 是一样的！
http://img3.douban.com/pics/nav/lg_main_a6.png
和
http://img3.douban.com////pics////nav///lg_main_a6.png
最终你都能到达

图片网址规范的html代码无非就是

1 php正则匹配图片路径原理与方法
??和??是非必需的，若要通过XHTML认证??、??、??、??必不可少。

就正则谈正则的话，我写出的最短匹配是

1 (?不过，这条在php里不行，会出现：

1 Warning: preg_match_all() [function.preg-match-all]: Compilation failed: lookbehind assertion is not fixed length at offset *** in ***
纠结了很久，都不行，原因何在呢？试了很多次，终于发现问题在(?

所以

1 (?或

1 (?

可能可以，但不保证100%没问题。

你也许会问，单纯

1 (?不行吗？通常情况，可以，但，搜索过页面的盆友应该知道，除了图片地址用src开头以外，javascript地址也用src开头！而且，太多神通广大的不可预知因素隐含其中，于是这个貌似很简短完美的写法就行不通了。
你又或许会问，聪明简短的不行，我把图片的后缀列出来，总该可以了吧，如

1 (?的确，这个写法实在是很老实，不过，你见过没有后缀的图片？wwe.com 有很多这种例子呢

RAW http://us.wwe.com/content/media/images/Headers/15559182
SmackDown http://us.wwe.com/content/media/images/Headers/15854138
NXT http://us.wwe.com/content/media/images/Headers/15929136
Superstars http://us.wwe.com/content/media/images/Headers/15815850

上面的网址都是图片，但都没有传统后缀，你老实也没用，还是不能获取到它们。

怎么办呢？还可以这样

1 php正则匹配图片路径原理与方法和上面的表达式不同，这次的结果中array[0]的内容不是我们想要的，我们要的图片地址在array[2]里。为什么呢？因为我们用了2个 (.*?)，每个“（）”的东西会自动存在一个组里，而array[0]代表结果的汇总，array[1]包含了img和src里的所有东西，array[2]才轮到我们想要的图片地址。这种匹配方法，既能匹配有传统后缀的图片，也能匹配一些无后缀的图片文件，同时又不会杀错其它src=文件。个人感觉还是不错的，呵呵。当然了，如果你还有更好的建议，请马上留言，全球人民都会感谢你！
你到底要什么样的图片，是固定格式还是其它？得具体情况具体分析呢。
我的建议是：
如果你要的图片地址的格式是img空格src=的，请使用：(?否则，请使用 php正则匹配图片路径原理与方法

并在项目中使用了很长时间的正则吧.

/"'s]*)/i

,我使用kindeditor保存文章,但是需要取出第N个图片的地址作为文章的标志图片,文章代码(内容的html)保存到数据库一个字段,然后图片地址保存到另外一个字段.我就是使用上面的正则解决的.

我说明下,上面的地址是直接获取img标签内src属性的值.在使用该正则的php页面访问该路径如果能找到图片的话,可以直接使用,如果不能,你可以使用preg_match_all将所有地址先保存到数组,然后处理路径,比如获取文件名称(不含路径部分),然后重新组成url,再删除图片.

我的例子:

preg_match_all("/"'s]*)/i",str_ireplace("","",$content),$arr);

呵呵我的内容部分被php给加上转义了,所以我需要先把去除,str_ireplace("","",$content),然后将匹配的内容保存到$arr数组(二维的).
$arr[1]就是存储该路径的数组.

本文地址：

转载随意，但请附上文章地址:-)

php正则匹配图片路径原理与方法

php与javascript正则匹配中文的方法分析

PHP文字转图片功能原理与实现方法分析

php正则匹配图片路径原理与方法

php正则匹配图片路径原理与方法

php正则匹配图片路径的方法参考

php与javascript正则匹配中文的方法分享

php正则匹配重写html图片img路径的代码一例

php与javascript正则匹配中文的方法分享

php与javascript正则匹配中文的方法实现详解

php正则匹配与替换回调内容标签的方法