欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Mysql以utf8存储gbk输出的实现方法提供

程序员文章站 2024-02-09 21:19:40
一个站有可能经历gb2312(gbk,big5)到utf8的转换过程,其中会遇到很多的问题。站点太庞大了怎么办呢,只能一步步来了。要是能在极少改动前端代码的情况下,先完成数...
一个站有可能经历gb2312(gbk,big5)到utf8的转换过程,其中会遇到很多的问题。站点太庞大了怎么办呢,只能一步步来了。要是能在极少改动前端代码的情况下,先完成数据的转换将会使整件事情容易得多。经过几天测试终于发现,mysql以utf8存储gbk输出是可以实现的。mysql4.1后都有个特性,可以指定当前客户端连接所使用的字符集,mysql默认都是latin1,或由mysql server端配置的字符集进行连接校对。我使用utf8_general_ci来创建字段。 
db:
sql代码:
复制代码 代码如下:

create table `table` (  
`id` int( 10 ) not null ,  
`name` varchar( 50 ) character set utf8 collate utf8_general_ci not null ,  
index ( `g_id` )   
) engine = innodb character set utf8 collate utf8_general_ci;  


php:
存储操作指定使用utf8字符集进行连接校对,读取操作指定使用gbk字符集进行连接校对。


php代码:
复制代码 代码如下:

<?php  
        //    select    db    and    set    link    use    utf8  
        function    _select_db_utf()  
        {  
        mysql_select_db($this->db_name,    $this->db_link);  


        //    init    character  
        mysql_query("set    names    utf8",    $this->db_link);  
        mysql_query("set    character    set    utf8",    $this->db_link);  
        mysql_query("set    collation_connection='utf8_general_ci'",    $this->db_link);  


        return    true;  
        }  


        //    select    db    and    set    link    use    gbk  
        function    _select_db_gb()  
        {  
        mysql_select_db($this->db_name,    $this->db_link);  


        //    init    character  
        mysql_query("set    names    gbk",    $this->db_link);  
        mysql_query("set    character    set    gbk",    $this->db_link);  
        mysql_query("set    collation_connection='gbk_chinese_ci'",    $this->db_link);  


        return    true;  
        }  
?>  
需要注意几点:
1. mysql必须把gbk,gb2312,utf8等字符集编译进去。
2. 入库的数据内容必须保证是最正确的utf8编码。
3. 存储和读取操作要指定正确的字符集进行连接校对。

要是前端代码操作数据入库不能以utf8进行,则需要对字符进行转码了。(例如用ajax提交的数据便是正确的utf8,这时是不用转换的。)

因为mb_string是php所支持字符最全的,而iconv比它稍差一点,mb_string并不能完全支持一些特殊字符的转码,所以目前为止都没有完美的转码方法。

再次对mb_string和iconv进行比较:

mb_string:
1. 所支持字符最全
2. 内容自动识别编码,不需要确定原来字符的编码,但是执行效率比iconv差太多
3. $content = mb_convert_encoding($content, "utf-8", "gbk,gb2312,big5");(顺序不同效果也有差异)

iconv:
1. 所支持字符不全
2. 需要确定原来字符的编码,但在确定编码的情况下执行效率比mb_convert_encoding高
3. $content = iconv("gbk", "utf-8", $content);