htmlでは、中国語をhtmlエンティティに変換して再出力する、すなわち、先頭のhtmlエンティティ符号化

5122 ワード

中国語をhtmlエンティティに変換して再出力する
エンコーディング
/**
 *   ""  html 
 *
 *
 * @param str
 * @return
 */
public static String encode(String str) {
  char[] arrs = str.toCharArray();//Hex.encodeHex();
  StringBuilder sb = new StringBuilder();
  for (char c : arrs) {
    // \\u  Unicode 。
    if (c >= '\u2E80' && c <= '\uFE4F') {//  [   [ \u4e00-\u9fa5]; (CJK Unified Ideographs) [\u2E80-\uFE4F]
      sb.append("").append((int)c).append(";");
    } else {
      sb.append(c);
    }
  }
  return sb.toString();
}

デコード:
/**
 *  ""  html   ( 5 , 。)
 *
 *  ( ) ( )
 *
 * @param str
 * @return
 */
@Deprecated
public static String decode(String str) {
  String[] tmp = str.split(";||;");
  StringBuilder sb = new StringBuilder("");
  for (int i = 0; i < tmp.length; i++) {
    if (tmp[i].matches("\\d{5}")) {
      sb.append((char) Integer.parseInt(tmp[i]));
    } else {
      sb.append(tmp[i]);
    }
  }
  return sb.toString();
}

HTML/text/JavaSript Escaping/Encoding Script http://scriptasylum.com/tutorials/encode-decode.html