pinin 4 j概要【转】
pinin 4 jのホームページ:http://pinyin4j.sourceforge.net/
pinin 4 jは中国語の文字から対応するピンインを取得できます.ピンインのフォーマットはカスタマイズできます.
pinin 4 jは中国語をピンインに変換するJavaオープンソースライブラリをサポートしています.
簡体字中国語と繁体字中国語の文字をサポートします.
中国語ピンイン、通用ピンイン、ウエートマールピンイン、注音記号第二式、イェールつづり法と国語ローマ字への変換をサポートします.
多音字に対応しています.つまり、中国語の文字の複数の発音を取得できます.
複数の文字列出力フォーマットをサポートしています.たとえば、Unicode形式の文字をサポートしています.ˉ",日当たりがいいˊ声をかけるˇ「去声」ˋ「)の出力
特徴:
1.複数のピンインシステムをサポートする:
中国語のピンイン
共通ピンイン
威氏のピンイン
注音二式
おれい
国語ローマ字
2.多音字対応
文脈に応じて正しいピンインが得られます.
3.複数のピンインフォーマットをサポートしています.
大文字と小文字
unicode u、v、uをサポートします.
デジタルトーン(l u 3)、トーン記号(lǚ)と無トーンの識別情報
Javaオープンソースライブラリを利用して漢字をピンインに変換する.
最近作ったプロジェクトは、コンボボックスの中の項目が多すぎて、フィルタリングの方法が必要です.
インターネットで探してみましたが、中国語を中国語のピンインに変換するためのJavaのオープンソースライブラリがあります.Pinin 4 j、
ダウンロード住所:pinin 4 j-2.50.zip
基本的な使い方は、以下の例です.
pinin 4 jは中国語の文字から対応するピンインを取得できます.ピンインのフォーマットはカスタマイズできます.
pinin 4 jは中国語をピンインに変換するJavaオープンソースライブラリをサポートしています.
簡体字中国語と繁体字中国語の文字をサポートします.
中国語ピンイン、通用ピンイン、ウエートマールピンイン、注音記号第二式、イェールつづり法と国語ローマ字への変換をサポートします.
多音字に対応しています.つまり、中国語の文字の複数の発音を取得できます.
複数の文字列出力フォーマットをサポートしています.たとえば、Unicode形式の文字をサポートしています.ˉ",日当たりがいいˊ声をかけるˇ「去声」ˋ「)の出力
特徴:
1.複数のピンインシステムをサポートする:
中国語のピンイン
共通ピンイン
威氏のピンイン
注音二式
おれい
国語ローマ字
2.多音字対応
文脈に応じて正しいピンインが得られます.
3.複数のピンインフォーマットをサポートしています.
大文字と小文字
unicode u、v、uをサポートします.
デジタルトーン(l u 3)、トーン記号(lǚ)と無トーンの識別情報
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
public class Pinyin
{
/**
*
*
* @param src
* @return String
*/
public static String getPinYin(String src)
{
char[] t1 = null;
t1 = src.toCharArray();
// System.out.println(t1.length);
String[] t2 = new String[t1.length];
// System.out.println(t2.length);
//
HanyuPinyinOutputFormat t3 = new HanyuPinyinOutputFormat();
t3.setCaseType(HanyuPinyinCaseType.LOWERCASE);
t3.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
t3.setVCharType(HanyuPinyinVCharType.WITH_V);
String t4 = "";
int t0 = t1.length;
try
{
for (int i = 0; i < t0; i++)
{
//
// System.out.println(t1[i]);
if (Character.toString(t1[i]).matches("[\\u4E00-\\u9FA5]+"))
{
t2 = PinyinHelper.toHanyuPinyinStringArray(t1[i], t3);// t2
t4 += t2[0];// t4
}
else
{
// , t4
t4 += Character.toString(t1[i]);
}
}
}
catch (BadHanyuPinyinOutputFormatCombination e)
{
// TODO Auto-generated catch block
e.printStackTrace();
}
return t4;
}
/**
*
*
* @param str
* @return String
*/
public static String getPinYinHeadChar(String str)
{
String convert = "";
for (int j = 0; j < str.length(); j++)
{
char word = str.charAt(j);
//
String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);
if (pinyinArray != null)
{
convert += pinyinArray[0].charAt(0);
}
else
{
convert += word;
}
}
return convert;
}
/**
* ASCII
*
* @param cnStr
* @return String
*/
public static String getCnASCII(String cnStr)
{
StringBuffer strBuf = new StringBuffer();
//
byte[] bGBK = cnStr.getBytes();
for (int i = 0; i < bGBK.length; i++)
{
// System.out.println(Integer.toHexString(bGBK[i] & 0xff));
// ASCII
strBuf.append(Integer.toHexString(bGBK[i] & 0xff));
}
return strBuf.toString();
}
public static void main(String[] args)
{
String cnStr = " ";
System.out.println(getPinYin(cnStr));
System.out.println(getPinYinHeadChar(cnStr));
System.out.println(getCnASCII(cnStr));
}
}
例:Javaオープンソースライブラリを利用して漢字をピンインに変換する.
最近作ったプロジェクトは、コンボボックスの中の項目が多すぎて、フィルタリングの方法が必要です.
インターネットで探してみましたが、中国語を中国語のピンインに変換するためのJavaのオープンソースライブラリがあります.Pinin 4 j、
ダウンロード住所:pinin 4 j-2.50.zip
基本的な使い方は、以下の例です.
Java
/**
* ,
* @author xuke
*
*/
public class Cn2Spell {
/**
* ,
* @param chines
* @return
*/
public static String converterToFirstSpell(String chines){
String pinyinName = "";
char[] nameChar = chines.toCharArray();
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
for (int i = 0; i < nameChar.length; i++) {
if (nameChar[i] > 128) {
try {
pinyinName += PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat)[0].charAt(0);
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
}else{
pinyinName += nameChar[i];
}
}
return pinyinName;
}
/**
* ,
* @param chines
* @return
*/
public static String converterToSpell(String chines){
String pinyinName = "";
char[] nameChar = chines.toCharArray();
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
for (int i = 0; i < nameChar.length; i++) {
if (nameChar[i] > 128) {
try {
pinyinName += PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat)[0];
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
}else{
pinyinName += nameChar[i];
}
}
return pinyinName;
}
public static void main(String[] args) {
System.out.println(converterToFirstSpell(" Java "));
}
}
/**
* ,
* @author xuke
*
*/
public class Cn2Spell {
/**
* ,
* @param chines
* @return
*/
public static String converterToFirstSpell(String chines){
String pinyinName = "";
char[] nameChar = chines.toCharArray();
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
for (int i = 0; i < nameChar.length; i++) {
if (nameChar[i] > 128) {
try {
pinyinName += PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat)[0].charAt(0);
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
}else{
pinyinName += nameChar[i];
}
}
return pinyinName;
}
/**
* ,
* @param chines
* @return
*/
public static String converterToSpell(String chines){
String pinyinName = "";
char[] nameChar = chines.toCharArray();
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
for (int i = 0; i < nameChar.length; i++) {
if (nameChar[i] > 128) {
try {
pinyinName += PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat)[0];
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
}else{
pinyinName += nameChar[i];
}
}
return pinyinName;
}
public static void main(String[] args) {
System.out.println(converterToFirstSpell(" Java "));
}
}
以上の一つは完全に中国語ピンインに変換したもので、もう一つは頭文字だけを変換したもので、ASCII文字に出会っても変換しないので、保留します.