java实现检测是否字符串中包含中文
程序员文章站
2024-03-31 19:29:04
代码非常实用,这里就不错废话,直接奉上
主要功能是实现判断字符串是否包含汉字 并且替换成ascll
private static string regex =...
代码非常实用,这里就不错废话,直接奉上
主要功能是实现判断字符串是否包含汉字 并且替换成ascll
private static string regex = "[\\u4e00-\\u9fa5]"; /** * 判断字符串是否包含汉字 并且替换成ascll * * @param str_para * @return str_result */ private static string ischinese_replace( string str_para ) { pattern p = pattern.compile( regex ); string str_result = str_para; string str_0 = ""; string str_1 = ""; string str_data[] = null; string str_return_reslut = ""; if ( str_result != null && str_result.trim().length() > 0 ) { try { str_data = str_result.split( "" ); for ( int i = 0; i < str_data.length; i++ ) { matcher m = p.matcher( str_data[i] ); /* l.d(str_data[i]); */ int count = 0; if ( m.find() ) { count++; str_result = m.group( 0 ); byte[] b = str_result.getbytes( "gbk" ); str_0 = integer.tohexstring( b[0] ); str_1 = integer.tohexstring( b[1] ); str_return_reslut = str_return_reslut + "/" + conver10( str_0 ) + conver10( str_1 ) + "/"; } else { str_return_reslut = str_return_reslut + str_data[i]; } } } catch ( numberformatexception e ) { e.printstacktrace(); } catch ( unsupportedencodingexception e ) { e.printstacktrace(); } } else { return(str_return_reslut); } return(str_return_reslut); } /* 字符串转换十进制 */ public static int conver10( string str_0 ) { return(integer.parseint( str_0.substring( str_0.length() - 2, str_0.length() ), 16 ) ); }
我们来看个稍微简单些的代码,一些需求不高的地方可以用到
import java.util.regex.matcher; import java.util.regex.pattern; public class demo { static string regex = "[\u4e00-\u9fa5]"; static pattern pat = pattern.compile(regex); public static void main(string[] args) { string input = "hell world!"; system.out.println(iscontainschinese(input)); input = "hello world"; system.out.println(iscontainschinese(input)); } public static boolean iscontainschinese(string str) { matcher matcher = pat.matcher(str); boolean flg = false; if (matcher.find()) { flg = true; } return flg; }
最后我们附上各种字符的unicode编码的范围:
* 汉字:[0x4e00,0x9fa5](或十进制[19968,40869])
* 数字:[0x30,0x39](或十进制[48, 57])
*小写字母:[0x61,0x7a](或十进制[97, 122])
* 大写字母:[0x41,0x5a](或十进制[65, 90])
上一篇: 详解Java的Hibernate框架中的搜索工具的运用
下一篇: Android实现酷炫的顶部栏