欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Java 汉字转拼音 完整代码实例(包含多音字解决方案)

程序员文章站 2024-02-03 11:33:22
汉字转换拼音的方法是使用到一个库:pinyin4j下载地址百度即可这里放一个maven依赖 com.belerweb pinyin4j 2.5.1后面就是完整的工具类和多音字解决方案pub...

汉字转换拼音的方法是使用到一个库:pinyin4j
下载地址:
https://download.csdn.net/download/pengfei1990/15562432

maven依赖

<dependency>
      <groupId>com.belerweb</groupId>
      <artifactId>pinyin4j</artifactId>
      <version>2.5.1</version>
</dependency>

后面就是完整的工具类和多音字解决方案

public class PinYinUtils {

  public static HanyuPinyinOutputFormat PINYIN_FORMAT;
  static {

    PINYIN_FORMAT = new HanyuPinyinOutputFormat();
    /**
     * 大小写设置
     *   LOWERCASE:小写
     *   UPPERCASE:大写
     */
    PINYIN_FORMAT.setCaseType(HanyuPinyinCaseType.LOWERCASE);
    /**
     * 输出音标设置
     *
     * WITH_TONE_MARK:直接用音标符(VCharType必须设置WITH_U_UNICODE,否则会抛出异常)
     * WITH_TONE_NUMBER:1-4数字表示音标
     * WITHOUT_TONE:没有音标
     */
    PINYIN_FORMAT.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
    /**
     * 特殊音符ü的设置
     * WITH_U_AND_COLON:用u表示(没有设置默认用u表示)
     * WITH_V:用v表示
     * WITH_U_UNICODE:用ü表示
     */
    PINYIN_FORMAT.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
  }

  /**
   * 取汉字的拼音首字母
   * @param chinese
   * @return
   */
  public static String toFirstPinYin(String chinese){
    StringBuilder result = new StringBuilder();
    //将字符串转成字符数组
    char[] chars = chinese.toCharArray();
    try {
      for (char c : chars) {
        //是中文则进行转换
        if(String.valueOf(c).matches("[\u4e00-\u9fa5]+")){
          String[] pinyinStr = PinyinHelper.toHanyuPinyinStringArray(c, PINYIN_FORMAT);
          result.append(pinyinStr[0].charAt(0));//取每个中文的第一个拼音字母
        }else {
          result.append(c);
        }
      }
    } catch (BadHanyuPinyinOutputFormatCombination badHanyuPinyinOutputFormatCombination) {
      badHanyuPinyinOutputFormatCombination.printStackTrace();
    }
    return result.toString();
  }

  /**
   * 汉字转拼音小写
   * @param chinese
   * @return
   */
  public static String toPinYin(String chinese){
    //创建返回对象
    StringBuilder result = new StringBuilder();//方法调用的时候新建,对象没有共享,不会有线程安全问题。
    //将字符串转成字符数组
    char[] chars = chinese.toCharArray();
    try {
      for (char c : chars) {
        //是中文则进行转换
        if(String.valueOf(c).matches("[\u4e00-\u9fa5]+")){
          String[] pinyinStr = PinyinHelper.toHanyuPinyinStringArray(c, PINYIN_FORMAT);
//          result.append(pinyinStr[0].charAt(0));//取每个中文的第一个拼音字母
          result.append(pinyinStr[0]);
        }else {
          result.append(c);
        }
      }
    } catch (BadHanyuPinyinOutputFormatCombination badHanyuPinyinOutputFormatCombination) {
      badHanyuPinyinOutputFormatCombination.printStackTrace();
    }
    return result.toString();
  }
  /**
   * 汉字转拼音每个字符串的第一个字母大写其余小写
   * @param chinese
   * @return
   */
  public static String toUpperStringsFirstCharPinYin(String chinese){
    //创建返回对象
    StringBuilder result = new StringBuilder();//方法调用的时候新建,对象没有共享,不会有线程安全问题。
    //将字符串转成字符数组
    char[] chars = chinese.toCharArray();
    try {
      for (char c : chars) {
        //是中文则进行转换
        if(String.valueOf(c).matches("[\u4e00-\u9fa5]+")){
          String[] pinyinStr = PinyinHelper.toHanyuPinyinStringArray(c, PINYIN_FORMAT);
//          result.append(pinyinStr[0].charAt(0));//取每个中文的第一个拼音字母
          String c1 = String.valueOf(pinyinStr[0]);
          result.append(c1.substring(0,1).toUpperCase()).append(c1.substring(1));
        }else {
          result.append(c);
        }
      }
    } catch (BadHanyuPinyinOutputFormatCombination badHanyuPinyinOutputFormatCombination) {
      badHanyuPinyinOutputFormatCombination.printStackTrace();
    }
    return result.toString();
  }

  public static void main(String[] args) {
    //测试StringBuilder是否有线程安全问题
    String str = "拼音工具lv";
    String pinYin = toUpperStringsFirstCharPinYin(str);
    System.out.println(pinYin);
  }
}

多音字解决方案:
这里用到了jar包中的实现,即添加扩展多音字的字典
MultiPinyinConfig.multiPinyinPath = XXXX.txt
字典格式如下:

朝阳站 (chao2,yang2,zhan4)
吴圩机场 (wu2,xu1,ji1,chang3)
长白山 (chang2,bai2,shan1)

希望对有汉字拼音转换有困惑的同学有帮助

本文地址:https://blog.csdn.net/pengfei1990/article/details/114368174