欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

java实现检测是否字符串中包含中文

程序员文章站 2024-03-31 19:29:04
代码非常实用,这里就不错废话,直接奉上 主要功能是实现判断字符串是否包含汉字 并且替换成ascll private static string regex =...

代码非常实用,这里就不错废话,直接奉上

主要功能是实现判断字符串是否包含汉字 并且替换成ascll

private static string regex = "[\\u4e00-\\u9fa5]";

  /**
   * 判断字符串是否包含汉字 并且替换成ascll
   *
   * @param str_para
   * @return str_result
   */
  private static string ischinese_replace( string str_para )
  {
    pattern p      = pattern.compile( regex );
    string str_result   = str_para;
    string str_0      = "";
    string str_1      = "";
    string str_data[]   = null;
    string str_return_reslut  = "";
    if ( str_result != null && str_result.trim().length() > 0 )
    {
      try {
        str_data = str_result.split( "" );
        for ( int i = 0; i < str_data.length; i++ )
        {
          matcher m = p.matcher( str_data[i] );
          /* l.d(str_data[i]); */
          int count = 0;
          if ( m.find() )
          {
            count++;
            str_result   = m.group( 0 );
            byte[] b    = str_result.getbytes( "gbk" );
            str_0      = integer.tohexstring( b[0] );
            str_1      = integer.tohexstring( b[1] );
            str_return_reslut  = str_return_reslut + "/" + conver10( str_0 ) + conver10( str_1 ) + "/";
          } else {
            str_return_reslut = str_return_reslut + str_data[i];
          }
        }
      } catch ( numberformatexception e ) {
        e.printstacktrace();
      } catch ( unsupportedencodingexception e ) {
        e.printstacktrace();
      }
    } else {
      return(str_return_reslut);
    }
    return(str_return_reslut);
  }
  /* 字符串转换十进制 */
  public static int conver10( string str_0 )
  {
    return(integer.parseint( str_0.substring( str_0.length() - 2, str_0.length() ), 16 ) );
  }

我们来看个稍微简单些的代码,一些需求不高的地方可以用到

import java.util.regex.matcher;
import java.util.regex.pattern;
public class demo {
static string regex = "[\u4e00-\u9fa5]";
static pattern pat = pattern.compile(regex);
public static void main(string[] args) {
string input = "hell world!";
system.out.println(iscontainschinese(input));
input = "hello world";
system.out.println(iscontainschinese(input));
}
  
public static boolean iscontainschinese(string str)
{
matcher matcher = pat.matcher(str);
boolean flg = false;
if (matcher.find())  {
flg = true;
}
return flg;
}

最后我们附上各种字符的unicode编码的范围:
     * 汉字:[0x4e00,0x9fa5](或十进制[19968,40869])
     * 数字:[0x30,0x39](或十进制[48, 57])
     *小写字母:[0x61,0x7a](或十进制[97, 122])
     * 大写字母:[0x41,0x5a](或十进制[65, 90])