構造化データ
978 ワード
構造化されたデータ:複数のデータ型を持つデータ. シーケンス化:構造化されたデータをデータストリームのフォーマット、すなわち文字列またはバイナリストリームに変更します. 構造化データ処理ツール:データシーケンス化および逆シーケンス化(データストリームから元の構造化データを復元)を実現します.次のようになります.
1)XML
2)JSON
3)Protocol Buffer
Protocol Buffer形式のデータとXMLとJSONの違い Protocol Bufferフォーマットのデータはバイナリストリームであり、読み取り不能である. XMLとJSONのすべての情報が含まれており、逆シーケンス化には追加情報は必要ありません. Protocol Buffer逆シーケンス化の場合は、予め定義されたデータフォーマットが必要です. Protocol Bufferシーケンス化されたデータはXMLフォーマットデータより3~10倍小さく、解析速度は20~100倍速い.
1)XML
Li Zhang
890
[email protected]
"
2)JSON
{
""name"":""Li Zhang"",
""id"":""890"",
""email"":""[email protected]"",
}
3)Protocol Buffer
:
message user{
optionial string name =1;
required int32 id = 2;
repeated string email = 3;
}
Protocol Buffer形式のデータとXMLとJSONの違い