phpQuery占用内存过多的处理方法
程序员文章站
2022-08-28 10:11:01
phpquery是一个用php实现的类似jquery的开源项目,可以在服务器端以jquery的语法形式解析网页元素。 相对于正则或其它方式匹配网页方式,phpquery使用...
phpquery是一个用php实现的类似jquery的开源项目,可以在服务器端以jquery的语法形式解析网页元素。 相对于正则或其它方式匹配网页方式,phpquery使用起来要方便的多。
在使用phpquery采集网页时,遇到一个问题:在处理大量网页之后,phpquery占用的内存数量非常惊人(很快就超过了1g),
比如这段代码:
while (true) {
phpquery::newdocumentfile($htmlfile);
// 处理网页元素...
echo memory_get_usage() . "\n";
}
谨慎运行上面这段代码,它会很快用光你的内存。
经过查看phpquery的源代码终于发现了问题所在,phpquery在每处理一个网页就会产生一个domdocumentwrapper 对象,而每个domdocumentwrapper 对象会被保存在静态成员$documents中(phpquery::createdocumentwrapper中),这个变量是一个数组,每解析一个网页数组元素就增加一个。
phpquery::$documents[$wrapper->id] = $wrapper;
找到问题后,解决就很容易了,每次解析完一个网页,把phpquery::$documents置空即可。
while (true) {
phpquery::newdocumentfile($htmlfile);
// 处理网页元素...
phpquery::$documents = array();
echo memory_get_usage() . "\n";
}
内存占用稳定了。
在使用phpquery采集网页时,遇到一个问题:在处理大量网页之后,phpquery占用的内存数量非常惊人(很快就超过了1g),
比如这段代码:
复制代码 代码如下:
while (true) {
phpquery::newdocumentfile($htmlfile);
// 处理网页元素...
echo memory_get_usage() . "\n";
}
谨慎运行上面这段代码,它会很快用光你的内存。
经过查看phpquery的源代码终于发现了问题所在,phpquery在每处理一个网页就会产生一个domdocumentwrapper 对象,而每个domdocumentwrapper 对象会被保存在静态成员$documents中(phpquery::createdocumentwrapper中),这个变量是一个数组,每解析一个网页数组元素就增加一个。
phpquery::$documents[$wrapper->id] = $wrapper;
找到问题后,解决就很容易了,每次解析完一个网页,把phpquery::$documents置空即可。
复制代码 代码如下:
while (true) {
phpquery::newdocumentfile($htmlfile);
// 处理网页元素...
phpquery::$documents = array();
echo memory_get_usage() . "\n";
}
内存占用稳定了。
推荐阅读
-
MSSQL数据库占用内存过大造成服务器死机问题的解决方法
-
Win7怎么查看内存占用率?Win7查看软件内存占用率的方法
-
Win10系统下chrome浏览器占用CPU过高的处理方法
-
window端口占用怎么处理(解决window端口被占用的方法)
-
window端口占用怎么处理(解决window端口被占用的方法)
-
360极速浏览器占用内存高怎么办 360极速浏览器占用内存大的原因和解决方法
-
Win10系统System进程占用CPU过高的处理方法
-
CI框架在CLI下执行占用内存过大问题的解决方法
-
10种检测Python程序运行时间、CPU和内存占用的方法
-
MSSQL数据库占用内存过大造成服务器死机问题的解决方法