htmlでは、中国語をhtmlエンティティに変換して再出力する、すなわち、先頭のhtmlエンティティ符号化
5122 ワード
中国語をhtmlエンティティに変換して再出力する
エンコーディング
デコード:
エンコーディング
/**
* "" html
*
*
* @param str
* @return
*/
public static String encode(String str) {
char[] arrs = str.toCharArray();//Hex.encodeHex();
StringBuilder sb = new StringBuilder();
for (char c : arrs) {
// \\u Unicode 。
if (c >= '\u2E80' && c <= '\uFE4F') {// [ [ \u4e00-\u9fa5]; (CJK Unified Ideographs) [\u2E80-\uFE4F]
sb.append("").append((int)c).append(";");
} else {
sb.append(c);
}
}
return sb.toString();
}
デコード:
/**
* "" html ( 5 , 。)
*
* ( ) ( )
*
* @param str
* @return
*/
@Deprecated
public static String decode(String str) {
String[] tmp = str.split(";||;");
StringBuilder sb = new StringBuilder("");
for (int i = 0; i < tmp.length; i++) {
if (tmp[i].matches("\\d{5}")) {
sb.append((char) Integer.parseInt(tmp[i]));
} else {
sb.append(tmp[i]);
}
}
return sb.toString();
}