欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

如何解决 UTF 文档中的乱码问题?

程序员文章站 2022-06-10 18:43:51
...
在浏览器中 Unicode 状态下,我看到这样的一个乱码,我尝试用 PHP 进行解码,失败了... 不过简单的文件编码转换,就成功了,步骤是这样的:
  1. 保持内容为 Western (ISO8859-1)格式

  2. 用浏览器开启,设置编码为 GB2312,完成

问题是这样的,我的文件如果必须要用 UTF8 编码,如何把这段乱码解码呢?

乱码内容是: '²»ÖªµÀÕâÑùµÄÖ÷»ú¡£'

回复内容:

在浏览器中 Unicode 状态下,我看到这样的一个乱码,我尝试用 PHP 进行解码,失败了... 不过简单的文件编码转换,就成功了,步骤是这样的:

  1. 保持内容为 Western (ISO8859-1)格式

  2. 用浏览器开启,设置编码为 GB2312,完成

问题是这样的,我的文件如果必须要用 UTF8 编码,如何把这段乱码解码呢?

乱码内容是: '²»ÖªµÀÕâÑùµÄÖ÷»ú¡£'

PHP扩展iconv是用来进行编码转换的。
转码方法为:

$text = iconv("ISO-8859-1", "UTF-8", $text)

答案没有那么简单,我刚刚试了一下,正确的方案是这样的

var_dump($str = iconv("UTF-8", "ISO-8859-1", '²»ÖªµÀÕâÑùµÄÖ÷»ú¡£'));
var_dump($str = iconv("GB18030", "UTF-8", $str));

首先要解码为 ISO-8859-1,不过这个状态下还是乱码,所以还要再转为 GB18030,然后再还原到 UTF-8 (与所在的文件匹配的编码)。

相关标签: php 乱码