java 中file.encoding的设置详解

程序员文章站 2024-02-29 15:39:22

java 中file.encoding的设置详解昨天有人在讨论关于设置system的property,file.encoding 修改defaultcharset无效...

java 中file.encoding的设置详解

昨天有人在讨论关于设置system的property,file.encoding 修改defaultcharset无效

properties pps=system.getproperties(); 
pps.setproperty("file.encoding","iso-8859-1");

在java中，如果没有指定charset的时候，比如new string(byte[] bytes),都会调用charset.defaultcharset()的方法

public static charset defaultcharset() { 
    if (defaultcharset == null) { 
    synchronized (charset.class) { 
    java.security.privilegedaction pa = 
      new getpropertyaction("file.encoding"); 
    string csn = (string)accesscontroller.doprivileged(pa); 
    charset cs = lookup(csn); 
    if (cs != null) 
      defaultcharset = cs; 
        else  
      defaultcharset = forname("utf-8"); 
      } 
  } 
  return defaultcharset; 
  }

我们可以清楚的看到defaultcharset是只能被初始化一次，这里还是有点小问题的，在多线程并发调用的时候还是会初始话多次，当然后面都是从cache（lookup的函数）里读出来的，问题也不大。

当我们在改变system.getproperties里的file.encoding 的时候，defaultcharset已经被初始化过了，所以不会在调用初始话的代码。

当jvm 启动的时候，load class, 最后调用main函数之前，defaultcharset已经初始化好，而很多函数里都掉用了这个方法象string.getbytes, 还有 inputstreamreader， inputstreamwriter 都是调用了 charset.defaultcharset()的方法，就不去追查谁先调用了defaultcharset。

对defaultcharset,在jvm里的语言就是初始话在启动的时候，而且不可被更改，你只能修改系统的charset,或者jvm的启动参数里加上 -dfile.encoding="utf-8"

题外话

在java里面string是使用char数组来表示，而java的char和c的char是不同的，java的char是双字节的, 而c 里面的char单字节，等同于java byte

也就是说我们在转化byte 到string的时候，是根据charset decode转化成char，而我们在调用println,write string的时候，还是要把char最后encode成byte 输出到控制台，或者文件中。

而在最后调用c函数write 的时候，如果是java 的byte数组，还要转化成c 里的char数组

(*env)->getbytearrayregion(env, bytes, off, len, (jbyte *)buf);

感谢阅读，希望能帮助到大家，谢谢大家，对本站的支持！

上一篇：详解MySQL中WHERE子句的用法

下一篇： spring boot装载自定义yml文件

java 中file.encoding的设置详解

详解MySQL中WHERE子句的用法

java中设计模式（多例）的实例详解

Java8与Scala中的Lambda表达式深入讲解

Python3中使用PyMongo的方法详解

java 中file.encoding的设置详解

java 中设计模式（值对象）的实例详解

详解Spring中bean实例化的三种方式

实例分析java中重载与重写的区别

详解在MySQL中创建表的教程

Android中Fragment的解析和使用详解