Java 判断字符串中是否包含中文的实例详解
程序员文章站
2024-02-26 17:23:46
java 判断字符串中是否包含中文的实例详解
java判断一个字符串是否有中文是利用unicode编码来判断,因为中文的编码区间为:0x4e00...
java 判断字符串中是否包含中文的实例详解
java判断一个字符串是否有中文是利用unicode编码来判断,因为中文的编码区间为:0x4e00--0x9fbb, 不过通用区间来判断中文也不非常精确,因为有些中文的标点符号利用区间判断会得到错误的结果。而且利用区间判断中文效率也并不高,例如:str.substring(i, i + 1).matches("[\\一-\\?]+"),就需要遍历整个字符串,如果字符串太长效率非常低,而且判断标点还会错误。这里提高 一个高效准确的判断方法,使用java中的character类:
实例代码:
package test; import static java.lang.character.unicodeblock.*; import com.google.common.base.strings; public class checkcontainchinese { public static void main(string[] args) { string containchinese = "test,我有中文"; string containnochiese = "test, i don't contain chinese"; system.out.println("containchinese 是否包含中文 :" + checkstringcontainchinese(containchinese)); system.out.println("containnochiese 是否包含中文 :" + checkstringcontainchinese(containnochiese)); } private static boolean checkstringcontainchinese(string checkstr){ if(!strings.isnullorempty(checkstr)){ char[] checkchars = checkstr.tochararray(); for(int i = 0; i < checkchars.length; i++){ char checkchar = checkchars[i]; if(checkcharcontainchinese(checkchar)){ return true; } } } return false; } private static boolean checkcharcontainchinese(char checkchar){ character.unicodeblock ub = character.unicodeblock.of(checkchar); if(cjk_unified_ideographs == ub || cjk_compatibility_ideographs == ub || cjk_compatibility_forms == ub || cjk_radicals_supplement == ub || cjk_unified_ideographs_extension_a == ub || cjk_unified_ideographs_extension_b == ub){ return true; } return false; } }
运行结果:
以上就是java 检查字符串是否含有中文的实例,如有疑问请留言或者到本站社区交流讨论,感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!