php解析xmlヒントInvalid byte 1 of 1-byte UTF-8 sequenceエラーの処理方法

761 ワード

エラーメッセージInvalid byte 1 of 1-byte UTF-8 sequence原因分析中国語版のwindowでjavaのデフォルトの符号化はGBK、つまりxmlをutf-8形式に保存することを識別したが、実際にファイルはGBK形式で保存されているので、これはなぜGBK、GB 2312符号化を使用してxmlファイルを生成して正確に解析できるのか、UTF-8形式で生成されたファイルがxml解析器で解析できない理由.
xmlのencoding属性値UTF-8をUTF 8 orgに変更する.xml.sax.SAXParseException:Content is not allowed in trailing section先要解析と文字列trim()を一度で解決します.解决:1、最も简単なのは2に変更するか、xmlを开いて保存する时文字セットをUTF-8に変更して保存またはプログラムを変更することです
 
  
 SAXReader reader = new SAXReader(); 
  org.dom4j.Document document = reader.read("D:\ha.xml"); 
  OutputFormat of = new OutputFormat(); 
  of.setEncoding("UTF-8"); //  
XMLWriter writer = new XMLWriter(new FileWriter "d:\dom4j.xml"), of);