欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

汉语转拼音之pinyin4j

程序员文章站 2022-07-15 09:34:29
...
      汉字转成拼音如果自己实现起来有点麻烦,主要是怕有些汉字转不了,所以就准备使用一个开源的工具Pinyin4j.
      pinyin4j是一个支持将中文转换到拼音的Java开源类库,pinyin4j能够根据中文字符获取其对应的拼音,而且拼音的格式可以定制。pinyin4j的主页:http://pinyin4j.sourceforge.net/
      1. 支持简体中文和繁体中文字符;
      2. 支持转换到汉语拼音,通用拼音, 威妥玛拼音(威玛拼法), 注音符号第二式, 耶鲁拼法和国语罗马字;
      3. 支持多音字,即可以获取一个中文字符的多种发音;
      4. 支持多种字符串输出格式,比如支持Unicode格式的字符ü和声调符号(阴平 "ˉ",阳平"ˊ",上声"ˇ",去声"ˋ")的输出。

    为了方便大家使用,我将源文件和jar包一并放上来了,欢迎大家下载。
     废话少说,下面是我建立的一个通用类,有什么不足的地方希望大家指正。
package com.xyj.com.tool.util;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

/**
 * @className:PinyingUtil.java
 * @classDescription:拼音操作工具类
 * @author:xiayingjie
 * @createTime:2010-10-21
 */

public class PinyingUtil {

	/**
	 * 将字符串转换成拼音数组
	 * 
	 * @param src
	 * @return
	 */
	public static String[] stringToPinyin(String src) {
		return stringToPinyin(src, false, null);
	}
	/**
	 * 将字符串转换成拼音数组
	 * 
	 * @param src
	 * @return
	 */
	public static String[] stringToPinyin(String src,String separator) {
		return stringToPinyin(src, true, separator);
	}

	/**
	 * 将字符串转换成拼音数组
	 * 
	 * @param src
	 * @param isPolyphone
	 *            是否查出多音字的所有拼音
	 * @param separator
	 *            多音字拼音之间的分隔符
	 * @return
	 */
	public static String[] stringToPinyin(String src, boolean isPolyphone,
			String separator) {
		// 判断字符串是否为空
		if ("".equals(src) || null == src) {
			return null;
		}
		char[] srcChar = src.toCharArray();
		int srcCount = srcChar.length;
		String[] srcStr = new String[srcCount];

		for (int i = 0; i < srcCount; i++) {
			srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator);
		}
		return srcStr;
	}

	/**
	 * 将单个字符转换成拼音
	 * 
	 * @param src
	 * @return
	 */
	public static String charToPinyin(char src, boolean isPolyphone,
			String separator) {
		// 创建汉语拼音处理类
		HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
		// 输出设置,大小写,音标方式
		defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
		defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

		StringBuffer tempPinying = new StringBuffer();
		

		// 如果是中文
		if (src > 128) {
			try {
				// 转换得出结果
				String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,
						defaultFormat);
				
						
				// 是否查出多音字,默认是查出多音字的第一个字符
				if (isPolyphone && null != separator) {
					for (int i = 0; i < strs.length; i++) {
						tempPinying.append(strs[i]);
						if (strs.length != (i + 1)) {
							// 多音字之间用特殊符号间隔起来
							tempPinying.append(separator);
						}
					}
				} else {
					tempPinying.append(strs[0]);
				}

			} catch (BadHanyuPinyinOutputFormatCombination e) {
				e.printStackTrace();
			}
		} else {
			tempPinying.append(src);
		}

		return tempPinying.toString();

	}

	
	public static String hanziToPinyin(String hanzi){
		return hanziToPinyin(hanzi," ");
	}
	/**
	 * 将汉字转换成拼音
	 * @param hanzi
	 * @param separator
	 * @return
	 */
	public static String hanziToPinyin(String hanzi,String separator){
			// 创建汉语拼音处理类
			HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
			// 输出设置,大小写,音标方式
			defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
			defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
			
			String pinyingStr="";
			try {
				pinyingStr=PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, separator);
			} catch (BadHanyuPinyinOutputFormatCombination e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
			}	
			return pinyingStr;
	}
	/**
	 * 将字符串数组转换成字符串
	 * @param str 
	 * @param separator 各个字符串之间的分隔符
	 * @return
	 */
	public static String stringArrayToString(String[] str, String separator) {
		StringBuffer sb = new StringBuffer();
		for (int i = 0; i < str.length; i++) {
			sb.append(str[i]);
			if (str.length != (i + 1)) {
				sb.append(separator);
			}
		}
		return sb.toString();
	}
	/**
	 * 简单的将各个字符数组之间连接起来
	 * @param str
	 * @return
	 */
	public  static String stringArrayToString(String[] str){
		return stringArrayToString(str,"");
	}
	/**
	 * 将字符数组转换成字符串
	 * @param str 
	 * @param separator 各个字符串之间的分隔符
	 * @return
	 */
	public static String charArrayToString(char[] ch, String separator) {
		StringBuffer sb = new StringBuffer();
		for (int i = 0; i < ch.length; i++) {
			sb.append(ch[i]);
			if (ch.length != (i + 1)) {
				sb.append(separator);
			}
		}
		return sb.toString();
	}
	
	/**
	 * 将字符数组转换成字符串
	 * @param str 
	 * @return
	 */
	public static String charArrayToString(char[] ch) {
		return charArrayToString(ch," ");
	}

	/**
	 * 取汉字的首字母
	 * @param src
	 * @param isCapital 是否是大写
	 * @return
	 */
	public static char[]  getHeadByChar(char src,boolean isCapital){
		//如果不是汉字直接返回
		if (src <= 128) {
			return new char[]{src};
		}
		//获取所有的拼音
		String []pinyingStr=PinyinHelper.toHanyuPinyinStringArray(src);
		//创建返回对象
		int polyphoneSize=pinyingStr.length;
		char [] headChars=new char[polyphoneSize];
		int i=0;
		//截取首字符
		for(String s:pinyingStr){
			char headChar=s.charAt(0);
			//首字母是否大写,默认是小写
			if(isCapital){
				headChars[i]=Character.toUpperCase(headChar);
			 }else{
				headChars[i]=headChar;
			 }
			i++;
		}
		
		return headChars;
	}
	/**
	 * 取汉字的首字母(默认是大写)
	 * @param src
	 * @return
	 */
	public static char[]  getHeadByChar(char src){
		return getHeadByChar(src,true);
	}
	/**
	 * 查找字符串首字母
	 * @param src 
	 * @return
	 */
	public  static String[] getHeadByString(String src){
		return getHeadByString( src, true);
	}
	/**
	 * 查找字符串首字母
	 * @param src 
	 * @param isCapital 是否大写
	 * @return
	 */
	public  static String[] getHeadByString(String src,boolean isCapital){
		return getHeadByString( src, isCapital,null);
	}
	/**
	 * 查找字符串首字母
	 * @param src 
	 * @param isCapital 是否大写
	 * @param separator 分隔符
	 * @return
	 */
	public  static String[] getHeadByString(String src,boolean isCapital,String separator){
		char[]chars=src.toCharArray();
		String[] headString=new String[chars.length];
		int i=0;
		for(char ch:chars){
			
			char[]chs=getHeadByChar(ch,isCapital);
			StringBuffer sb=new StringBuffer();
			if(null!=separator){
				int j=1;
				
				for(char ch1:chs){
					sb.append(ch1);
					if(j!=chs.length){
						sb.append(separator);
					}
					j++;
				}
			}else{
				sb.append(chs[0]);
			}
			headString[i]=sb.toString();
			i++;
		}
		return headString;
	}
	
	public static void main(String[] args) {
		System.out.println(stringArrayToString(getHeadByString("我se 心")));
	}

}