欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

php字符编码问题详解

程序员文章站 2022-05-18 09:54:03
...
  1. 页面标题
  2. 您好!
复制代码

用 ie 浏览器打开网站的这一页面。可以看到,页面显示正常。在 ie 浏览器的“查看”/“编码”菜单下看到(勾选了“自动选择”),字符编码是 gb2312。 [firefox 2.0 下显示正常。] 1.2 然后,在 ultraedit 的“文件”菜单下,选“另存为”,格式选择“utf-8”,文件名为 test2.php。用 ie 浏览器打开这一页面。可以看到,页面显示正常(其实英文字体已经有略微的变化了)。在 ie 浏览器的“查看”/“编码”菜单下看到(勾选了“自动选择”),字符编码是 utf-8,自动变了!注意 一句并没有修改,但是浏览器却自动辨别出了真实的字符集编码!看来 ie 还是比较聪明的,也说明 ie 自动判别字符集是比 mete 标签中 charset=xxx 的定义优先的。 [firefox 2.0 下显示出现乱码。] 1.3 在该页面首部加语句

  1. header("content-type:text/html;charset=utf-8");
  2. ?>
复制代码

再次保存该页面文件,“格式”下拉框选择“默认”,文件名为 test3.php。用 ie 打开网站里的该文件,这次看到,除过英文字母,汉字变成乱码了!同时在 ie 浏览器的“查看”/“编码”菜单下看到(勾选了“自动选择”),字符编码是 utf-8,已经被强制改变了。 出现汉字乱码的原因,是因为原本的 gb2312 编码,被强制以 utf-8 的编码形式显示,所以乱码出现了。这个时候在浏览器里人为指定 gb2312 编码,页面汉字又显示正常了(真正制作页面时是不能这么做的,非要让浏览者自己选择编码,一个是浏览者可能根本不知道怎么选择编码、选什么编码,再者也显得我们太菜了!)。 [firefox 2.0 下显示出现乱码。] 1.4 在该页面首部加语句

  1. header("content-type:text/html;charset=gb2312");
  2. ?>
复制代码

再次保存该页面文件,“格式”下拉框选择“utf-8”,文件名为 test4.php。用 ie 打开网站里的该文件,奇怪:看到页面汉字显示正常,并不是预想到的乱码?!在 ie 浏览器的“查看”/“编码”菜单下看到(勾选了“自动选择”),字符编码仍然是 utf-8,并没有被强制改变了 gb2312 字符集。 这个时候在浏览器里人为指定 gb2312 编码,发现 ie 浏览器并不能人为指定编码。看来 ie 浏览器对 utf-8 字符集特别关照。无论是在 meta 标签指定,还是 php 语句指定,都不能让 ie 浏览器显示出汉字乱码。 [firefox 2.0 下显示出现乱码。] 小结: 以上测试主要在 ie7.0 下进行,web 服务器为 windows server 2003 下的 iis6.0,php 版本为 4.4.7。可以看到,ie7.0 为了正确识别字符集做了很多额外的自动处理的工作,以显示其智能和友好。有时太殷勤了反而使我们不知所措。由于汉字乱码问题与不同的浏览器及其不同的版本、web 服务器、后台脚本和不同的字符集都有点关系,所以问题显得特别复杂。作为 web 编程人员,主要关心与自己有关的因素就可以了,没必要成为字符集编码方面的专家。为了兼容目前流行的 ie 和 ff 浏览器,我们可以按照以下简单的方法处理我们的 php 代码: 1,页面的真正字符集与 meta 标签指定的应该一致; 2,也可以使用 header("content-type:text/html;charset=xxx"); 语句指定字符集,但是不能与字符的真正字符集冲突,也不能与 meta 标签冲突。(尽管根据测试结果表明,当 header() 和 meta 冲突时,header() 比 meta 指定的字符集更优先,因为根据 httpwatch basic 跟踪显示,header() 指定字符集后,ie 浏览器 type 会明确的得到字符集指定。但是不能保证其它非主流浏览器也会这样。) 3,不能与数据库取回的字符的字符集冲突,否则页面会出现页面本身的汉字和数据库取回的汉字,全部乱码或部分乱码问题。