Java 判断字符为中文实例代码(超管用)
程序员文章站
2024-03-09 10:00:47
在做项目中经常会遇到有项目需求是需要判断字符为中文的一些问题,所以搜集了判断中文字符的代码片段,特此分享供大家参考。
直接贴出代码了,里面有详细的注释。
pac...
在做项目中经常会遇到有项目需求是需要判断字符为中文的一些问题,所以搜集了判断中文字符的代码片段,特此分享供大家参考。
直接贴出代码了,里面有详细的注释。
package com.coder4j.main; import java.util.regex.pattern; /** * java 判断中文字符 * * @author chinaxiang * @date 2015-08-11 * */ public class checkchinese { public static void main(string[] args) { // 纯英文 string s1 = "hello,tom.!@#$%^&*()_+-={}|[];':\"?"; // 纯中文(不含中文标点) string s2 = "你好中国"; // 纯中文(含中文标点) string s3 = "你好,中国。《》:“”‘';()【】!¥、"; // 韩文 string s4 = "한국어난"; // 日文 string s5 = "ぎじゅつ"; // 特殊字符 string s6 = "��"; string s7 = "╃"; string s8 = "╂"; // 繁体中文 string s9 = "蒼老師"; // 1 使用字符范围判断 system.out.println("s1是否包含中文:" + haschinesebyrange(s1));// false system.out.println("s2是否包含中文:" + haschinesebyrange(s2));// true system.out.println("s3是否包含中文:" + haschinesebyrange(s3));// true system.out.println("s4是否包含中文:" + haschinesebyrange(s4));// false system.out.println("s5是否包含中文:" + haschinesebyrange(s5));// false system.out.println("s6是否包含中文:" + haschinesebyrange(s6));// false system.out.println("s7是否包含中文:" + haschinesebyrange(s7));// false system.out.println("s8是否包含中文:" + haschinesebyrange(s8));// false system.out.println("s9是否包含中文:" + haschinesebyrange(s9));// true system.out.println("-------分割线-------"); system.out.println("s1是否全是中文:" + ischinesebyrange(s1));// false system.out.println("s2是否全是中文:" + ischinesebyrange(s2));// true system.out.println("s3是否全是中文:" + ischinesebyrange(s3));// false 中文标点不在范围内 system.out.println("s4是否全是中文:" + ischinesebyrange(s4));// false system.out.println("s5是否全是中文:" + ischinesebyrange(s5));// false system.out.println("s6是否全是中文:" + ischinesebyrange(s6));// false system.out.println("s7是否全是中文:" + ischinesebyrange(s7));// false system.out.println("s8是否全是中文:" + ischinesebyrange(s8));// false system.out.println("s9是否全是中文:" + ischinesebyrange(s9));// true system.out.println("-------分割线-------"); // 2 使用字符范围正则判断(结果同1) system.out.println("s1是否包含中文:" + haschinesebyreg(s1));// false system.out.println("s2是否包含中文:" + haschinesebyreg(s2));// true system.out.println("s3是否包含中文:" + haschinesebyreg(s3));// true system.out.println("s4是否包含中文:" + haschinesebyreg(s4));// false system.out.println("s5是否包含中文:" + haschinesebyreg(s5));// false system.out.println("s6是否包含中文:" + haschinesebyreg(s6));// false system.out.println("s7是否包含中文:" + haschinesebyreg(s7));// false system.out.println("s8是否包含中文:" + haschinesebyreg(s8));// false system.out.println("s9是否包含中文:" + haschinesebyreg(s9));// true system.out.println("-------分割线-------"); system.out.println("s1是否全是中文:" + ischinesebyreg(s1));// false system.out.println("s2是否全是中文:" + ischinesebyreg(s2));// true system.out.println("s3是否全是中文:" + ischinesebyreg(s3));// false 中文标点不在范围内 system.out.println("s4是否全是中文:" + ischinesebyreg(s4));// false system.out.println("s5是否全是中文:" + ischinesebyreg(s5));// false system.out.println("s6是否全是中文:" + ischinesebyreg(s6));// false system.out.println("s7是否全是中文:" + ischinesebyreg(s7));// false system.out.println("s8是否全是中文:" + ischinesebyreg(s8));// false system.out.println("s9是否全是中文:" + ischinesebyreg(s9));// true system.out.println("-------分割线-------"); // 3 使用cjk字符集判断 system.out.println("s1是否包含中文:" + haschinese(s1));// false system.out.println("s2是否包含中文:" + haschinese(s2));// true system.out.println("s3是否包含中文:" + haschinese(s3));// true system.out.println("s4是否包含中文:" + haschinese(s4));// false system.out.println("s5是否包含中文:" + haschinese(s5));// false system.out.println("s6是否包含中文:" + haschinese(s6));// false system.out.println("s7是否包含中文:" + haschinese(s7));// false system.out.println("s8是否包含中文:" + haschinese(s8));// false system.out.println("s9是否包含中文:" + haschinese(s9));// true system.out.println("-------分割线-------"); system.out.println("s1是否全是中文:" + ischinese(s1));// false system.out.println("s2是否全是中文:" + ischinese(s2));// true system.out.println("s3是否全是中文:" + ischinese(s3));// true 中文标点也被包含进来 system.out.println("s4是否全是中文:" + ischinese(s4));// false system.out.println("s5是否全是中文:" + ischinese(s5));// false system.out.println("s6是否全是中文:" + ischinese(s6));// false system.out.println("s7是否全是中文:" + ischinese(s7));// false system.out.println("s8是否全是中文:" + ischinese(s8));// false system.out.println("s9是否全是中文:" + ischinese(s9));// true } /** * 是否包含中文字符<br> * 包含中文标点符号<br> * * @param str * @return */ public static boolean haschinese(string str) { if (str == null) { return false; } char[] ch = str.tochararray(); for (char c : ch) { if (ischinese(c)) { return true; } } return false; } /** * 是否全是中文字符<br> * 包含中文标点符号<br> * * @param str * @return */ public static boolean ischinese(string str) { if (str == null) { return false; } char[] ch = str.tochararray(); for (char c : ch) { if (!ischinese(c)) { return false; } } return true; } /** * 是否是中文字符<br> * 包含中文标点符号<br> * * @param c * @return */ private static boolean ischinese(char c) { character.unicodeblock ub = character.unicodeblock.of(c); if (ub == character.unicodeblock.cjk_unified_ideographs) { return true; } else if (ub == character.unicodeblock.cjk_compatibility_ideographs) { return true; } else if (ub == character.unicodeblock.cjk_symbols_and_punctuation) { return true; } else if (ub == character.unicodeblock.cjk_unified_ideographs_extension_a) { return true; } else if (ub == character.unicodeblock.cjk_unified_ideographs_extension_b) { return true; } else if (ub == character.unicodeblock.cjk_unified_ideographs_extension_c) { return true; } else if (ub == character.unicodeblock.cjk_unified_ideographs_extension_d) { return true; } else if (ub == character.unicodeblock.general_punctuation) { return true; } else if (ub == character.unicodeblock.halfwidth_and_fullwidth_forms) { return true; } return false; } /** * 是否包含汉字<br> * 根据汉字编码范围进行判断<br> * cjk统一汉字(不包含中文的,。《》()“‘'”、!¥等符号)<br> * * @param str * @return */ public static boolean haschinesebyreg(string str) { if (str == null) { return false; } pattern pattern = pattern.compile("[\\u4e00-\\u9fbf]+"); return pattern.matcher(str).find(); } /** * 是否全是汉字<br> * 根据汉字编码范围进行判断<br> * cjk统一汉字(不包含中文的,。《》()“‘'”、!¥等符号)<br> * * @param str * @return */ public static boolean ischinesebyreg(string str) { if (str == null) { return false; } pattern pattern = pattern.compile("[\\u4e00-\\u9fbf]+"); return pattern.matcher(str).matches(); } /** * 是否包含汉字<br> * 根据汉字编码范围进行判断<br> * cjk统一汉字(不包含中文的,。《》()“‘'”、!¥等符号)<br> * * @param str * @return */ public static boolean haschinesebyrange(string str) { if (str == null) { return false; } char[] ch = str.tochararray(); for (char c : ch) { if (c >= 0x4e00 && c <= 0x9fbf) { return true; } } return false; } /** * 是否全是汉字<br> * 根据汉字编码范围进行判断<br> * cjk统一汉字(不包含中文的,。《》()“‘'”、!¥等符号)<br> * * @param str * @return */ public static boolean ischinesebyrange(string str) { if (str == null) { return false; } char[] ch = str.tochararray(); for (char c : ch) { if (c < 0x4e00 || c > 0x9fbf) { return false; } } return true; } }
如果仅仅去判断是否是中文,不需判断中文标点的话,推荐使用正则去匹配,可能更高效点。
以上代码内容给大家介绍了java 判断字符为中文实例代码(超管用),希望对大家有所帮助。