调试一段PHP程序时遇到的三个问题

程序员文章站 2023-02-26 15:09:05

1，filesize()函数返回错误的值。使用curl将某个页面下载到本地时，需要将下载到的临时文件tmphtml.txt的内容读取到一个缓冲区中。由于我使用fread(...

1，filesize()函数返回错误的值。
使用curl将某个页面下载到本地时，需要将下载到的临时文件tmphtml.txt的内容读取到一个缓冲区中。由于我使用fread()进行读取，需要传入要读取的大小，所以先用filesize(‘./tmphtml.txt')获取临时文件大小。怪异的是，获取到的临时文件大小不正确，下断点调试，在filesize()调用后，手工去硬盘上寻找文件，文件大小与filesize()得到的结果不一样。
在php.net上搜索filesize，可以看到函数说明中有这么一句：note: 此函数的结果会被缓存。参见 clearstatcache() 以获得更多细节。
再去查阅clearstatcache()，果然找到了原因：
php将缓存这些（提供了函数表供查询）函数的返回信息以提供更快的性能。然而在某些情况下，你可能想清除被缓存的信息。例如如果在一个脚本中多次检查同一个文件，而该文件在此脚本执行期间有被删除或修改的危险时，你需要清除文件状态缓存。这种情况下，可以用 clearstatcache() 函数来清除被 php 缓存的该文件信息。
2，在utf-8编码的php脚本中，对gbk编码的中文网页内容做模式匹配时，如何匹配中文。
在昨天的开发中，需要匹配包含gbk编码字符串‘苹果'的内容，所以写出如下代码：

复制代码代码如下:

 
$pat = '/<img onclick="zoom\(this, \'(attachments.*?)\'\)".*?alt="苹果\.jpg" \/><\/a>/'; 
$pat = iconv(‘utf-8', ‘gb2312', $pat); 
$ret = preg_match_all($pat, $contents, $matches); 

可是死活匹配不上，于是尝试先将内容转换成utf-8编码，如下：

复制代码代码如下:

 
$pat = '/<img onclick="zoom\(this, \'(attachments.*?)\'\)".*?alt="苹果\.jpg" \/><\/a>/'; 
$contenst = iconv(‘gb2312', ‘utf-8', $contents); 
$ret = preg_match_all($pat, $contents, $matches); 

于是就能匹配上了。但是想不通啊，怀疑这里面有诈。
但悲剧的是，今天又用了第一种方法，又匹配中了。看来问题出在别的地方。
啊！老夫是猪，问题2是由问题1引起的！filesize()获取的不对，自然匹配不上了！第二种方法匹配上，是在解决问题1之后啊！

3，浏览器中审查元素得到的报价图片下载地址，为何与curl得到的下载地址不同。
可能……最后答案依然是：我是猪。
因为uri对象为：attachment.php？aid=mzk3mtb8ytg5ztyyntj8mtmynjcyndewmxw5nwyydc9aoue0a05evm9ydlersfbramzjnwjql1nhdwjlk3zrau9gtdzydnbudw%3d%3d&nothumb=yes
aid是个什么呢？很可能是个与session有关的东东，变一变也很正常的嘛。后来抓看起来像静态路径的东东就没问题了。

以上三个故事中包含两个悲剧，这就是php初学者必犯的低级错误。

上一篇： php下批量挂马和批量清马代码

下一篇： php设计模式 Singleton(单例模式)

调试一段PHP程序时遇到的三个问题