欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Orace查询数据出现乱码的问题解决思路

程序员文章站 2023-08-16 12:37:57
问题描述: 经常有些朋友会遇到,我明明是输入的正确中文,为什么我在另外一台电脑上查询却出现乱码啦?其实这个是数据库在进行字符集转换的时候出现了问题, 下面通过测试来描述具体...
问题描述
经常有些朋友会遇到,我明明是输入的正确中文,为什么我在另外一台电脑上查询却出现乱码啦?其实这个是数据库在进行字符集转换的时候出现了问题,
下面通过测试来描述具体的情况:

1.环境
oracle 数据库字符集:
connected to oracle database 11g enterprise edition release 11.2.0.1.0
connected as scott
sql> select * from database_properties where property_name = 'nls_characterset';
property_name property_value description
------------------------------ -------------------------------------------------------------------------------- ------------------------------------------------------------------------------
nls_characterset zhs16gbk character set
oracle 数据库所在的客服端字符集:
在注册表的:nls_lang=simplified chinese_china.zhs16gbk 如下图:
Orace查询数据出现乱码的问题解决思路 
oracle 所在的操作系统的字符集:
microsoft windows [版本 6.1.7601]
版权所有 (c) 2009 microsoft corporation。保留所有权利。
c:\users\andy>chcp
活动代码页: 936
表示是:中国 - 简体中文(gb2312)

2.测试
字符集如下:
oracle 数据库字符集:zhs16gbk
oracle 数据库客户端字符集:zhs16gbk
操作系统字符集:中国 - 简体中文(gb2312)
输入测试数据:
sql> insert into tab_indx
2 values(1,'汉字输入字符集测试','chinese input test',sysdate);
1 row inserted
字符集不修改,进行测试数据现实:
sql> select * from tab_indx where tid = 1;
tid tname tdesc sysdt
---------- -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- -----------
1 汉字输入字符集测试 chinese input test 2012/12/30
显示正常,
现在我把客服端的字符集修改为:utf8
及注册表的:nls_lang=simplified chinese_china.utf8
现在字符集如下:
oracle 数据库字符集:zhs16gbk
oracle 数据库客户端字符集:utf8
操作系统字符集:中国 - 简体中文(gb2312)
现在再查询刚才输入的数据:
sql> select tname,tdesc from tab_indx;
tname tdesc
-------------------------------------------------------------------------------- --------------------------------------------------------------------------------
发现查询出来的数据已经不能正常现实,因为这些汉字是以zhs16gbk编码格式存储的,然而你查询出来后根据oracle客服端的编码(utf8)转换,及转成了utf8的编码格式,但是操作系统是简体中文(gb2312),所以操作系统就把utf8编码格式的数据,当成简体中文(gb2312)的编码格式数据显示,结果就出现了乱码,
现在我再插入一笔数据:
sql> insert into tab_indx
2 values(1,'utf8下汉字输入字符集测试','chinese input test',sysdate);
1 row inserted
再查询:
sql> select tname,tdesc from tab_indx;
tname tdesc
-------------------------------------------------------------------------------- --------------------------------------------------------------------------------
发现新插入的数据也出现了乱码,但是乱码跟刚才的值不一样??为什么呢?
因为输入的汉字,是简体中文(gb2312)的编码格式,当oracle数据库按照客户端的编码格式传给数据库,oracle数据库发现,oracle数据库客户端是utf8的编码格式,跟数据库的编码格式(zhs16gbk)不一样,就进行字符集转换,utf8-->zhs16gbk,所以把简体中文(gb2312)的编码格式的数据当成utf8,转为zhs16gbk的编码格式数据,就已经出错啦,查询出来自然转换回去就不行啦
(本来需要测试oracle数据库的字符集修改后的情况,这种情况暂时不测试)这里我们在把oracle客户的字符集修改回去;
在注册表的:nls_lang=simplified chinese_china.zhs16gbk
现在字符集如下
oracle 数据库字符集:zhs16gbk
oracle 数据库客户端字符集:zhs16gbk
操作系统字符集:中国 - 简体中文(gb2312)
再查询:
sql> select tname,tdesc from tab_indx;
tname tdesc
-------------------------------------------------------------------------------- --------------------------------------------------------------------------------
汉字输入字符集测试 chinese input test
utf8????????????? chinese input test
发现最开始输入的汉字正常啦,但是第二次输入的汉字,又变了,跟上次的乱码不一样????
虽然这里没有进行编码格式转换,但是上次在存数据的时候,已经是存的错误的编码格式,所以显示出来肯定不正确
其实还有好几种情况测试,由于本地环境的限制,所以测试的其它情况,大家可以去试试,如:数据库的字符集是utf8,然后客服端的字符集变化,对汉字的输入输出有什么影响
根据上面的测试情况和我自己的分析,现在总结如下:
1.数据库的查询出来的数据,是oracle数据库字符集,oracle客户端字符集,操作系统字符集共同作用的结果。
2.oracle存数据和查询数据都是通过oracle数据库的字符集和oracle客服端的字符集进行转换的,显示数据又是根据操作系统的字符集来确定的。
3.为了避免出现乱码必须要把oracle客户端的字符集和操作系统的字符集设置成一样的。