HTMLのエスケープ文字はどのように処理しますか?よくあるエスケープ文字はどれらがありますか?


HTMLページでは、エスケープ文字の処理に問題があります.まずエスケープ文字について説明しますが、通常はこのように定義されています.すべてのASCIIコードは「」と数字(一般的には8進数)で表すことができます.Cでは、一般的に表示できないASCII文字を表すアルファベットの前に「」を付ける文字が定義されています.例えば、「0,t」など、変換文字と呼ばれています.後ろの文字なので、本来のASCII文字の意味ではありません.
まず、次の行のHTMLソースコードを見てみましょう.
<span class="sourceLineNo">033</span> * <p><a name="line.33"></a>

<最終javaファイルに書き込むときに処理しないと、最後に次のように表示されるエスケープ文字です.
* <p>
次のHTMLソースコードを見てみましょう.
<span class="sourceLineNo">084</span>    private boolean hasChar() {<a name="line.84"></a>
<span class="sourceLineNo">085</span>        return this.pos < this.len;<a name="line.85"></a>
<span class="sourceLineNo">086</span>    }<a name="line.86"></a>

エスケープ文字を処理しない場合は、次のようになります.
    private boolean hasChar() {         return this.pos < this.len;     }
必要なのは
    private boolean hasChar() {         return this.pos < this.len;     }
これは明らかに私たちが望んでいる結果ではありません.だから、これらのエスケープ文字はjava仕様に合致する文字に変換する必要があります.私たちは次のツールクラスを使用して、エスケープ文字の翻訳を完了します.
	/*
	 * HTML        private String escapeCharacterUtil(String parseredLine)
	 * 
	 * HTML      :
	 * 1,<     java      < 
	 * 2,>     java      >
	 * 3,&    java      &
	 * 4,"   java      "
	 * 5,&copy;   java       ©
	 */
	private String escapeCharacterUtil(String parseredLine){
		
		//    
		final_line = parseredLine.replaceAll("<", "<").replace(">", ">").replace("&", "&").replace(""", "\"");
		
		return final_line;
	}


上記のいくつかはHTMLでよく見られるエスケープ文字です.一般的なエスケープ文字もありますが、その後も研究があります.