Java 汉字转拼音 完整代码实例(包含多音字解决方案)
程序员文章站
2024-02-03 11:33:22
汉字转换拼音的方法是使用到一个库:pinyin4j下载地址百度即可这里放一个maven依赖 com.belerweb pinyin4j 2.5.1 后面就是完整的工具类和多音字解决方案pub...
汉字转换拼音的方法是使用到一个库:pinyin4j
下载地址:
https://download.csdn.net/download/pengfei1990/15562432
maven依赖
<dependency>
<groupId>com.belerweb</groupId>
<artifactId>pinyin4j</artifactId>
<version>2.5.1</version>
</dependency>
后面就是完整的工具类和多音字解决方案
public class PinYinUtils {
public static HanyuPinyinOutputFormat PINYIN_FORMAT;
static {
PINYIN_FORMAT = new HanyuPinyinOutputFormat();
/**
* 大小写设置
* LOWERCASE:小写
* UPPERCASE:大写
*/
PINYIN_FORMAT.setCaseType(HanyuPinyinCaseType.LOWERCASE);
/**
* 输出音标设置
*
* WITH_TONE_MARK:直接用音标符(VCharType必须设置WITH_U_UNICODE,否则会抛出异常)
* WITH_TONE_NUMBER:1-4数字表示音标
* WITHOUT_TONE:没有音标
*/
PINYIN_FORMAT.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
/**
* 特殊音符ü的设置
* WITH_U_AND_COLON:用u表示(没有设置默认用u表示)
* WITH_V:用v表示
* WITH_U_UNICODE:用ü表示
*/
PINYIN_FORMAT.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
}
/**
* 取汉字的拼音首字母
* @param chinese
* @return
*/
public static String toFirstPinYin(String chinese){
StringBuilder result = new StringBuilder();
//将字符串转成字符数组
char[] chars = chinese.toCharArray();
try {
for (char c : chars) {
//是中文则进行转换
if(String.valueOf(c).matches("[\u4e00-\u9fa5]+")){
String[] pinyinStr = PinyinHelper.toHanyuPinyinStringArray(c, PINYIN_FORMAT);
result.append(pinyinStr[0].charAt(0));//取每个中文的第一个拼音字母
}else {
result.append(c);
}
}
} catch (BadHanyuPinyinOutputFormatCombination badHanyuPinyinOutputFormatCombination) {
badHanyuPinyinOutputFormatCombination.printStackTrace();
}
return result.toString();
}
/**
* 汉字转拼音小写
* @param chinese
* @return
*/
public static String toPinYin(String chinese){
//创建返回对象
StringBuilder result = new StringBuilder();//方法调用的时候新建,对象没有共享,不会有线程安全问题。
//将字符串转成字符数组
char[] chars = chinese.toCharArray();
try {
for (char c : chars) {
//是中文则进行转换
if(String.valueOf(c).matches("[\u4e00-\u9fa5]+")){
String[] pinyinStr = PinyinHelper.toHanyuPinyinStringArray(c, PINYIN_FORMAT);
// result.append(pinyinStr[0].charAt(0));//取每个中文的第一个拼音字母
result.append(pinyinStr[0]);
}else {
result.append(c);
}
}
} catch (BadHanyuPinyinOutputFormatCombination badHanyuPinyinOutputFormatCombination) {
badHanyuPinyinOutputFormatCombination.printStackTrace();
}
return result.toString();
}
/**
* 汉字转拼音每个字符串的第一个字母大写其余小写
* @param chinese
* @return
*/
public static String toUpperStringsFirstCharPinYin(String chinese){
//创建返回对象
StringBuilder result = new StringBuilder();//方法调用的时候新建,对象没有共享,不会有线程安全问题。
//将字符串转成字符数组
char[] chars = chinese.toCharArray();
try {
for (char c : chars) {
//是中文则进行转换
if(String.valueOf(c).matches("[\u4e00-\u9fa5]+")){
String[] pinyinStr = PinyinHelper.toHanyuPinyinStringArray(c, PINYIN_FORMAT);
// result.append(pinyinStr[0].charAt(0));//取每个中文的第一个拼音字母
String c1 = String.valueOf(pinyinStr[0]);
result.append(c1.substring(0,1).toUpperCase()).append(c1.substring(1));
}else {
result.append(c);
}
}
} catch (BadHanyuPinyinOutputFormatCombination badHanyuPinyinOutputFormatCombination) {
badHanyuPinyinOutputFormatCombination.printStackTrace();
}
return result.toString();
}
public static void main(String[] args) {
//测试StringBuilder是否有线程安全问题
String str = "拼音工具lv";
String pinYin = toUpperStringsFirstCharPinYin(str);
System.out.println(pinYin);
}
}
多音字解决方案:
这里用到了jar包中的实现,即添加扩展多音字的字典
MultiPinyinConfig.multiPinyinPath = XXXX.txt
字典格式如下:
朝阳站 (chao2,yang2,zhan4)
吴圩机场 (wu2,xu1,ji1,chang3)
长白山 (chang2,bai2,shan1)
希望对有汉字拼音转换有困惑的同学有帮助
本文地址:https://blog.csdn.net/pengfei1990/article/details/114368174