Orace查询数据出现乱码的问题解决思路
程序员文章站
2023-12-02 08:10:22
问题描述: 经常有些朋友会遇到,我明明是输入的正确中文,为什么我在另外一台电脑上查询却出现乱码啦?其实这个是数据库在进行字符集转换的时候出现了问题, 下面通过测试来描述具体...
问题描述:
经常有些朋友会遇到,我明明是输入的正确中文,为什么我在另外一台电脑上查询却出现乱码啦?其实这个是数据库在进行字符集转换的时候出现了问题,
下面通过测试来描述具体的情况:
1.环境
oracle 数据库字符集:
connected to oracle database 11g enterprise edition release 11.2.0.1.0
connected as scott
sql> select * from database_properties where property_name = 'nls_characterset';
property_name property_value description
------------------------------ -------------------------------------------------------------------------------- ------------------------------------------------------------------------------
nls_characterset zhs16gbk character set
oracle 数据库所在的客服端字符集:
在注册表的:nls_lang=simplified chinese_china.zhs16gbk 如下图:
oracle 所在的操作系统的字符集:
microsoft windows [版本 6.1.7601]
版权所有 (c) 2009 microsoft corporation。保留所有权利。
c:\users\andy>chcp
活动代码页: 936
表示是:中国 - 简体中文(gb2312)
2.测试
字符集如下:
oracle 数据库字符集:zhs16gbk
oracle 数据库客户端字符集:zhs16gbk
操作系统字符集:中国 - 简体中文(gb2312)
输入测试数据:
sql> insert into tab_indx
2 values(1,'汉字输入字符集测试','chinese input test',sysdate);
1 row inserted
字符集不修改,进行测试数据现实:
sql> select * from tab_indx where tid = 1;
tid tname tdesc sysdt
---------- -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- -----------
1 汉字输入字符集测试 chinese input test 2012/12/30
显示正常,
现在我把客服端的字符集修改为:utf8
及注册表的:nls_lang=simplified chinese_china.utf8
现在字符集如下:
oracle 数据库字符集:zhs16gbk
oracle 数据库客户端字符集:utf8
操作系统字符集:中国 - 简体中文(gb2312)
现在再查询刚才输入的数据:
sql> select tname,tdesc from tab_indx;
tname tdesc
-------------------------------------------------------------------------------- --------------------------------------------------------------------------------
发现查询出来的数据已经不能正常现实,因为这些汉字是以zhs16gbk编码格式存储的,然而你查询出来后根据oracle客服端的编码(utf8)转换,及转成了utf8的编码格式,但是操作系统是简体中文(gb2312),所以操作系统就把utf8编码格式的数据,当成简体中文(gb2312)的编码格式数据显示,结果就出现了乱码,
现在我再插入一笔数据:
sql> insert into tab_indx
2 values(1,'utf8下汉字输入字符集测试','chinese input test',sysdate);
1 row inserted
再查询:
sql> select tname,tdesc from tab_indx;
tname tdesc
-------------------------------------------------------------------------------- --------------------------------------------------------------------------------
发现新插入的数据也出现了乱码,但是乱码跟刚才的值不一样??为什么呢?
因为输入的汉字,是简体中文(gb2312)的编码格式,当oracle数据库按照客户端的编码格式传给数据库,oracle数据库发现,oracle数据库客户端是utf8的编码格式,跟数据库的编码格式(zhs16gbk)不一样,就进行字符集转换,utf8-->zhs16gbk,所以把简体中文(gb2312)的编码格式的数据当成utf8,转为zhs16gbk的编码格式数据,就已经出错啦,查询出来自然转换回去就不行啦
(本来需要测试oracle数据库的字符集修改后的情况,这种情况暂时不测试)这里我们在把oracle客户的字符集修改回去;
在注册表的:nls_lang=simplified chinese_china.zhs16gbk
现在字符集如下:
oracle 数据库字符集:zhs16gbk
oracle 数据库客户端字符集:zhs16gbk
操作系统字符集:中国 - 简体中文(gb2312)
再查询:
sql> select tname,tdesc from tab_indx;
tname tdesc
-------------------------------------------------------------------------------- --------------------------------------------------------------------------------
汉字输入字符集测试 chinese input test
utf8????????????? chinese input test
发现最开始输入的汉字正常啦,但是第二次输入的汉字,又变了,跟上次的乱码不一样????
虽然这里没有进行编码格式转换,但是上次在存数据的时候,已经是存的错误的编码格式,所以显示出来肯定不正确
其实还有好几种情况测试,由于本地环境的限制,所以测试的其它情况,大家可以去试试,如:数据库的字符集是utf8,然后客服端的字符集变化,对汉字的输入输出有什么影响
根据上面的测试情况和我自己的分析,现在总结如下:
1.数据库的查询出来的数据,是oracle数据库字符集,oracle客户端字符集,操作系统字符集共同作用的结果。
2.oracle存数据和查询数据都是通过oracle数据库的字符集和oracle客服端的字符集进行转换的,显示数据又是根据操作系统的字符集来确定的。
3.为了避免出现乱码必须要把oracle客户端的字符集和操作系统的字符集设置成一样的。
经常有些朋友会遇到,我明明是输入的正确中文,为什么我在另外一台电脑上查询却出现乱码啦?其实这个是数据库在进行字符集转换的时候出现了问题,
下面通过测试来描述具体的情况:
1.环境
oracle 数据库字符集:
connected to oracle database 11g enterprise edition release 11.2.0.1.0
connected as scott
sql> select * from database_properties where property_name = 'nls_characterset';
property_name property_value description
------------------------------ -------------------------------------------------------------------------------- ------------------------------------------------------------------------------
nls_characterset zhs16gbk character set
oracle 数据库所在的客服端字符集:
在注册表的:nls_lang=simplified chinese_china.zhs16gbk 如下图:
oracle 所在的操作系统的字符集:
microsoft windows [版本 6.1.7601]
版权所有 (c) 2009 microsoft corporation。保留所有权利。
c:\users\andy>chcp
活动代码页: 936
表示是:中国 - 简体中文(gb2312)
2.测试
字符集如下:
oracle 数据库字符集:zhs16gbk
oracle 数据库客户端字符集:zhs16gbk
操作系统字符集:中国 - 简体中文(gb2312)
输入测试数据:
sql> insert into tab_indx
2 values(1,'汉字输入字符集测试','chinese input test',sysdate);
1 row inserted
字符集不修改,进行测试数据现实:
sql> select * from tab_indx where tid = 1;
tid tname tdesc sysdt
---------- -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- -----------
1 汉字输入字符集测试 chinese input test 2012/12/30
显示正常,
现在我把客服端的字符集修改为:utf8
及注册表的:nls_lang=simplified chinese_china.utf8
现在字符集如下:
oracle 数据库字符集:zhs16gbk
oracle 数据库客户端字符集:utf8
操作系统字符集:中国 - 简体中文(gb2312)
现在再查询刚才输入的数据:
sql> select tname,tdesc from tab_indx;
tname tdesc
-------------------------------------------------------------------------------- --------------------------------------------------------------------------------
发现查询出来的数据已经不能正常现实,因为这些汉字是以zhs16gbk编码格式存储的,然而你查询出来后根据oracle客服端的编码(utf8)转换,及转成了utf8的编码格式,但是操作系统是简体中文(gb2312),所以操作系统就把utf8编码格式的数据,当成简体中文(gb2312)的编码格式数据显示,结果就出现了乱码,
现在我再插入一笔数据:
sql> insert into tab_indx
2 values(1,'utf8下汉字输入字符集测试','chinese input test',sysdate);
1 row inserted
再查询:
sql> select tname,tdesc from tab_indx;
tname tdesc
-------------------------------------------------------------------------------- --------------------------------------------------------------------------------
发现新插入的数据也出现了乱码,但是乱码跟刚才的值不一样??为什么呢?
因为输入的汉字,是简体中文(gb2312)的编码格式,当oracle数据库按照客户端的编码格式传给数据库,oracle数据库发现,oracle数据库客户端是utf8的编码格式,跟数据库的编码格式(zhs16gbk)不一样,就进行字符集转换,utf8-->zhs16gbk,所以把简体中文(gb2312)的编码格式的数据当成utf8,转为zhs16gbk的编码格式数据,就已经出错啦,查询出来自然转换回去就不行啦
(本来需要测试oracle数据库的字符集修改后的情况,这种情况暂时不测试)这里我们在把oracle客户的字符集修改回去;
在注册表的:nls_lang=simplified chinese_china.zhs16gbk
现在字符集如下:
oracle 数据库字符集:zhs16gbk
oracle 数据库客户端字符集:zhs16gbk
操作系统字符集:中国 - 简体中文(gb2312)
再查询:
sql> select tname,tdesc from tab_indx;
tname tdesc
-------------------------------------------------------------------------------- --------------------------------------------------------------------------------
汉字输入字符集测试 chinese input test
utf8????????????? chinese input test
发现最开始输入的汉字正常啦,但是第二次输入的汉字,又变了,跟上次的乱码不一样????
虽然这里没有进行编码格式转换,但是上次在存数据的时候,已经是存的错误的编码格式,所以显示出来肯定不正确
其实还有好几种情况测试,由于本地环境的限制,所以测试的其它情况,大家可以去试试,如:数据库的字符集是utf8,然后客服端的字符集变化,对汉字的输入输出有什么影响
根据上面的测试情况和我自己的分析,现在总结如下:
1.数据库的查询出来的数据,是oracle数据库字符集,oracle客户端字符集,操作系统字符集共同作用的结果。
2.oracle存数据和查询数据都是通过oracle数据库的字符集和oracle客服端的字符集进行转换的,显示数据又是根据操作系统的字符集来确定的。
3.为了避免出现乱码必须要把oracle客户端的字符集和操作系统的字符集设置成一样的。