php上传中文文件文件名乱码问题,
程序员文章站
2024-02-14 18:06:28
...
php上传中文文件文件名乱码问题,
php上传文件是最最基础的一个技术点,但是深入进去也有不少问题需要解决,这不,上传中文文件后,文件名变成了乱码。
下面是问题代码,很简单:
1.问题代码
html部分:
1 html> 2 body> 3 4 form action="upload_file.php" method="post" 5 enctype="multipart/form-data"> 6 label for="file">Filename:label> 7 input type="file" name="file" id="file" /> 8 br /> 9 input type="submit" name="submit" value="Submit" /> 10 form> 11 12 body> 13 html>
php部分:
1 php 2 if ($_FILES["file"]["error"] > 0) 3 { 4 echo "Return Code: " . $_FILES["file"]["error"] . "
"; 5 }else 7 { 8 echo "Upload: " . $_FILES["file"]["name"] . "
"; 9 echo "Type: " . $_FILES["file"]["type"] . "
"; 10 echo "Size: " . ($_FILES["file"]["size"] / 1024) . " Kb
"; 11 echo "Temp file: " . $_FILES["file"]["tmp_name"] . "
"; 12 13 if (file_exists("upload/" . $_FILES["file"]["name"])) 14 { 15 echo $_FILES["file"]["name"] . " already exists. "; 16 } 17 else 18 { 19 move_uploaded_file($_FILES["file"]["tmp_name"], 20 "upload/" . $_FILES["file"]["name"]);
}
}
上传了一个文件名为“测试数据.txt”的文件,oh ho,文件是传上去了,但是文件名为乱码。
2.初试
网上搜索一下解决方案,将
move_uploaded_file($_FILES["file"]["tmp_name"], "upload/" . $_FILES["file"]["name"]);
改成
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("UTF-8","gbk",$_FILES["file"]["name"]));
结果发现iconv函数返回值为false。
查一下函数手册,发现第二个参数有特别的用法,简单翻译一下就是我可以在编码的后面追加//TRANSLIT 或 //IGNORE ,前者会将无法翻译的字符转成最接近的字符,后者就是直接忽略不能转化的字符。
试一下:
1 var_dump( iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"])); 2 var_dump( iconv("UTF-8","gbk//IGNORE",$_FILES["file"]["name"]));
结果:
bool(false) string(4) ".txt"
也就是说中文都没法转化,甚至连接近的字符都没有,看来网上介绍的方法也并非万能。
3.网上介绍方法失败,再尝试
猜测一下,也许我的系统在创建中文文件的时候会乱码,于是我将代码改写了一下:
move_uploaded_file($_FILES["file"]["tmp_name"], "upload/测试数据.txt");
结果创建成功,没有乱码。。。也就是说不是系统问题。
想一下,我的php文件本身是utf8编码的,那么
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/测试数据.txt");
这个语句肯定使用的是utf8编码,那么之前上传的文件名肯定就不是utf8编码了,那么以下的语句肯定是错误的,因为源字符串本身就不是utf8编码的:
iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"]);
使用函数检查源字符串的编码:
1 $e=mb_detect_encoding($text, array(‘UTF-8’, ‘GBK’,’gb2312’)); 2 echo $e;
结果是CP936,也就是源字符串编码是GBK。
试一下
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("gbk","UTF-8",$_FILES["file"]["name"]));
问题解决,不再乱码
4.另一种解决办法
实际上还有一种解决办法,就是在html文件的head标签中间加入
meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
从而使编码保持统一,也就不需要再转码了
5.下面是结论
上一篇: php的变量范围、引用、对象引用、传递
下一篇: postgresql导出数据表还原