欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

PHP实现UTF-8文件BOM自动检测与移除实例

程序员文章站 2023-04-06 09:10:35
本文实例讲述了php实现utf-8文件bom自动检测与移除的方法。分享给大家供大家参考。具体实现方法如下: bom信息是文件开头的一串隐藏的字符,用于让某些编辑器识别这是...

本文实例讲述了php实现utf-8文件bom自动检测与移除的方法。分享给大家供大家参考。具体实现方法如下:

bom信息是文件开头的一串隐藏的字符,用于让某些编辑器识别这是个utf-8编码的文件。但php在读取文件时会把这些字符读出,从而形成了文件 开头含有一些无法识别的字符的问题。

比如用utf-8格式保存的生成图片的php文件,因为文件头隐藏的bom信息也被下发,导致生成的 图片数据不对,浏览器无法识别。

要检测一个utf-8文件是否含有bom信息,就是检测文件开头的字三个符,是否为0xef, 0xbb, 0xbf。下面这个小程序,用户遍历某个目录下所有文件,并检测是否加了bom。

复制代码 代码如下:
<?php
//此文件用于快速测试utf8编码的文件是不是加了bom,并可自动移除
//by bob shen

$basedir="."; //修改此行为需要检测的目录,点表示当前目录
$auto=1; //是否自动移除发现的bom信息。1为是,0为否。

//以 下不用改动

if ($dh = opendir($basedir)) {
while (($file = readdir($dh)) !== false) {
if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) echo "filename: $file ".checkbom("$basedir/$file")." <br>";
}
closedir($dh);
}

function checkbom ($filename) {
global $auto;
$contents=file_get_contents($filename);
$charset[1]=substr($contents, 0, 1);
$charset[2]=substr($contents, 1, 1);
$charset[3]=substr($contents, 2, 1);
if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) {
if ($auto==1) {
$rest=substr($contents, 3);
rewrite ($filename, $rest);
return ("<font color=red>bom found, automatically removed.</font>");
} else {
return ("<font color=red>bom found.</font>");
}
}
else return ("bom not found.");
}

function rewrite ($filename, $data) {
$filenum=fopen($filename,"w");
flock($filenum,lock_ex);
fwrite($filenum,$data);
fclose($filenum);
}


将以上代码另存为del_bom.php,修改需要检测的目录后运行。这样可能有助于检测是哪个文件带有了bom信息导致所有页面开头都有 那么一段空白。

把下面 代码保存为 bom.php  记得保存为 utf8 格式

复制代码 代码如下:
<meta http-equiv="content-type" content="text/html; charset=utf-8">
<h3><?echo $_post["dir"];?>目录下的检测结果</h3>
<?php
//此文件用于快速测试utf8编码的文件是 不是加了bom,并可自动移除
//by bob 老大
//风吟修改
$目录= str_replace(" ", "|", $_post["dir"]);//接受提交的路径数据
$basedir="$目录"; //修改此行为需要检测的目录,点表示当前目录
$auto=1; //是否自动移除发现的bom信息。1为是,0为否。
//以下不用改动
if ($dh = opendir($basedir)) {
while (($file = readdir($dh)) !== false) {
if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) echo "filename: $file ".checkbom("$basedir/$file")." <br>";
}
closedir($dh);
}
function checkbom ($filename) {
global $auto;
$contents=file_get_contents($filename);
$charset[1]=substr($contents, 0, 1);
$charset[2]=substr($contents, 1, 1);
$charset[3]=substr($contents, 2, 1);
if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) {
if ($auto==1) {
$rest=substr($contents, 3);
rewrite ($filename, $rest);
return ("<font color=red>--bom 已经清除完毕。</font>");
} else {
return ("<font color=red>--bom found.</font>");
}
}
else return ("--没有检查到bom.");
}
function rewrite ($filename, $data) {
$filenum=fopen($filename,"w");
flock($filenum,lock_ex);
fwrite($filenum,$data);
fclose($filenum);
}
?>

<form action="" method="post">
目录: <input type="text" name="dir" />
<input type="submit" value="检测目录" >
</form>
请 输入文件夹名比如 plugin/fanfou 后面不需要加/。如果要检测根目录输入“ . ”  . 是小数点 提交既可
</br>

希望本文所述对大家的php程序设计有所帮助。