【Hive】解析json(get_json_object)
get_json_object(string json_string, string path)
説明:1番目のパラメータはjson対象変数を記入し、2番目のパラメータは$でjson変数を表す標識を使用し、その後使用する.または[]オブジェクトまたは配列を読み込みます.入力したjson文字列が無効な場合はNULLを返します.毎回1つのデータ項目しか返されません.
例:dataはtestテーブルのフィールドであり、データ構造は以下の通りである.
1.get単層値
2.get多層値.
3.get配列値[]
説明:1番目のパラメータはjson対象変数を記入し、2番目のパラメータは$でjson変数を表す標識を使用し、その後使用する.または[]オブジェクトまたは配列を読み込みます.入力したjson文字列が無効な場合はNULLを返します.毎回1つのデータ項目しか返されません.
例:dataはtestテーブルのフィールドであり、データ構造は以下の通りである.
data =
{
"store":
{
"fruit":[{"weight":8,"type":"apple"}, {"weight":9,"type":"pear"}],
"bicycle":{"price":19.95,"color":"red"}
},
"email":"amy@only_for_json_udf_test.net",
"owner":"amy"
}
1.get単層値
hive> select get_json_object(data, '$.owner') from test;
:amy
2.get多層値.
hive> select get_json_object(data, '$.store.bicycle.price') from test;
:19.95
3.get配列値[]
hive> select get_json_object(data, '$.store.fruit[0]') from test;
:{"weight":8,"type":"apple"}