完美转换MySQL的字符集 解决查看utf8源文件中的乱码问题
程序员文章站
2023-12-18 14:29:46
mysql从4.1版本开始才提出字符集的概念,所以对于mysql4.0及其以下的版本,他们的字符集都是latin1的,所以有时候需要对mysql的字符集进行一下转换,mys...
mysql从4.1版本开始才提出字符集的概念,所以对于mysql4.0及其以下的版本,他们的字符集都是latin1的,所以有时候需要对mysql的字符集进行一下转换,mysql版本的升级、降级,特别是升级mysql的版本,为了不让程序继续沿用latin1字符集之后对以后discuz!版本升级的影响和安装supesite,这就需要我们进行字符集的转换!
本人转换过好多数据了,也用过了好多的办法,个人感觉最好用的就是使用mysql命令导出导入中将字符集转换过去!
现在我将用图文并茂的方式向大家展示一下如何将mysql字符集进行转换,由于字符集比较多,现在主要举gbk和latin1这两种字符集之间的转换!
首先我将讲解一下如何将mysql从gbk转换为latin1的(如果是utf8或者big5转换即将gbk换成相应的字符集即可)!这种问题常发生在mysql从mysql4.1及其以上版本转换为
mysql4.1以下的版本的过程中!有的人图个方便,特别是有主机权限的,直接将mysql的data目录下的文件拷贝过去了,这样造成的问题就是乱码问题!当然我所说的这些都要求你必
须拥有主机权限,虚拟主机用户可以在本地搭建好论坛,下载数据到你的本地,然后把数据导入到你本地的数据库,然后进行字符集的转换!
现在的步骤就是将mysql的数据导出了,在mysql的命令提示符下(linux系统为mysql的命令目录下),输入下面导出的命令:
mysqldump -uroot -p --default-character-set=gbk --set-charset=latin1 --compatible=mysql40 --skip-opt discuz>discuz.sql
如图1(windows下)和图2(linux下)所示
这样就轻松的将数据从mysql数据库中导出了,此时导出的文件在与mysql命令同级的目录下,即bin目录下,而且已经将mysql字符集导出为latin1的了!现在要做的就是将数据导
入mysql4.0中去!
同样在4.0版本的mysql命令提示符下(linux系统为mysql的命令目录下),输入下面导入命令:
mysql -uroot -p --default-character-set=latin1 -f discuz<discuz.sql
如图3(window下)和图4(linux下)所示
这样就将字符集从gbk转为latin1同时将mysql从4.1以上版本的转为mysql4.0的了!
现在讲解一下如何从latin1字符集转换为gbk的!
由于只有mysql4.1以上的版本才有字符集的概念,所以如果你要将mysql4.0的字符集从latin1转换为gbk字符集的话,必须导入到mysql4.1以上的版本中,然后再导出!这里面就多
了一个导出为latin1的步骤!
同样在mysql4.0的命令提示符下,输入下面导出的命令:
mysqldump -uroot -p --default-character-set=latin1 --set-charset=latin1 --skip-opt discuz>discuz.sql
然后导入到mysql4.1中,输入下面导入的命令:
mysql -uroot -p --default-character-set=latin1 -f discuz<discuz.sql
然后在mysql4.1下转换字符集,分别输入下面导出和导入的命令:
mysqldump -uroot -p --default-character-set=latin1 --set-charset=gbk --skip-opt discuz>discuz.sql
mysql -uroot -p --default-character-set=gbk -f newdiscuz<discuz.sql
如果不出问题的话,那么转换就完毕了!其实整个过程还是比较简单的,只是过程看起来比较麻烦些,但是过程却是很简单明了的!
下面举出一个在导入过程中极易容易出现的问题!
在导入的时候容易出现unknown command '/'这样的错误,其实这是由于mysql在导出的时候,它有时候给一些繁体字后面自动加上了个反斜杠造成的!解决此问题的办法就是打开
备份的sql(这里为discuz.sql),提示错误的时候会提示具体哪行出现了错误,找到那行,把反斜杠去掉就行了!其实你可以用ultraedit这些文本处理的工具,批量的去处理这些反斜杠
!凭个人经验,有很多用户名取的比较怪,这样就容易出现反斜杠,这样只要纠正那些用户名就行了!
以上是个人在转换数据过程中的一些经验之谈,很多地方还有待大家完善!
本人转换过好多数据了,也用过了好多的办法,个人感觉最好用的就是使用mysql命令导出导入中将字符集转换过去!
现在我将用图文并茂的方式向大家展示一下如何将mysql字符集进行转换,由于字符集比较多,现在主要举gbk和latin1这两种字符集之间的转换!
首先我将讲解一下如何将mysql从gbk转换为latin1的(如果是utf8或者big5转换即将gbk换成相应的字符集即可)!这种问题常发生在mysql从mysql4.1及其以上版本转换为
mysql4.1以下的版本的过程中!有的人图个方便,特别是有主机权限的,直接将mysql的data目录下的文件拷贝过去了,这样造成的问题就是乱码问题!当然我所说的这些都要求你必
须拥有主机权限,虚拟主机用户可以在本地搭建好论坛,下载数据到你的本地,然后把数据导入到你本地的数据库,然后进行字符集的转换!
现在的步骤就是将mysql的数据导出了,在mysql的命令提示符下(linux系统为mysql的命令目录下),输入下面导出的命令:
mysqldump -uroot -p --default-character-set=gbk --set-charset=latin1 --compatible=mysql40 --skip-opt discuz>discuz.sql
如图1(windows下)和图2(linux下)所示
这样就轻松的将数据从mysql数据库中导出了,此时导出的文件在与mysql命令同级的目录下,即bin目录下,而且已经将mysql字符集导出为latin1的了!现在要做的就是将数据导
入mysql4.0中去!
同样在4.0版本的mysql命令提示符下(linux系统为mysql的命令目录下),输入下面导入命令:
mysql -uroot -p --default-character-set=latin1 -f discuz<discuz.sql
如图3(window下)和图4(linux下)所示
这样就将字符集从gbk转为latin1同时将mysql从4.1以上版本的转为mysql4.0的了!
现在讲解一下如何从latin1字符集转换为gbk的!
由于只有mysql4.1以上的版本才有字符集的概念,所以如果你要将mysql4.0的字符集从latin1转换为gbk字符集的话,必须导入到mysql4.1以上的版本中,然后再导出!这里面就多
了一个导出为latin1的步骤!
同样在mysql4.0的命令提示符下,输入下面导出的命令:
mysqldump -uroot -p --default-character-set=latin1 --set-charset=latin1 --skip-opt discuz>discuz.sql
然后导入到mysql4.1中,输入下面导入的命令:
mysql -uroot -p --default-character-set=latin1 -f discuz<discuz.sql
然后在mysql4.1下转换字符集,分别输入下面导出和导入的命令:
mysqldump -uroot -p --default-character-set=latin1 --set-charset=gbk --skip-opt discuz>discuz.sql
mysql -uroot -p --default-character-set=gbk -f newdiscuz<discuz.sql
如果不出问题的话,那么转换就完毕了!其实整个过程还是比较简单的,只是过程看起来比较麻烦些,但是过程却是很简单明了的!
下面举出一个在导入过程中极易容易出现的问题!
在导入的时候容易出现unknown command '/'这样的错误,其实这是由于mysql在导出的时候,它有时候给一些繁体字后面自动加上了个反斜杠造成的!解决此问题的办法就是打开
备份的sql(这里为discuz.sql),提示错误的时候会提示具体哪行出现了错误,找到那行,把反斜杠去掉就行了!其实你可以用ultraedit这些文本处理的工具,批量的去处理这些反斜杠
!凭个人经验,有很多用户名取的比较怪,这样就容易出现反斜杠,这样只要纠正那些用户名就行了!
以上是个人在转换数据过程中的一些经验之谈,很多地方还有待大家完善!