【Hive】解析json(get_json_object)

2195 ワード

get_json_object(string json_string, string path)
説明:1番目のパラメータはjson対象変数を記入し、2番目のパラメータは$でjson変数を表す標識を使用し、その後使用する.または[]オブジェクトまたは配列を読み込みます.入力したjson文字列が無効な場合はNULLを返します.毎回1つのデータ項目しか返されません.
例:dataはtestテーブルのフィールドであり、データ構造は以下の通りである.
data =
{
 "store":
        {
         "fruit":[{"weight":8,"type":"apple"}, {"weight":9,"type":"pear"}],  
         "bicycle":{"price":19.95,"color":"red"}
         }, 
 "email":"amy@only_for_json_udf_test.net", 
 "owner":"amy" 
}

1.get単層値
hive> select  get_json_object(data, '$.owner') from test;
  :amy

2.get多層値.
hive> select  get_json_object(data, '$.store.bicycle.price') from test;
  :19.95

3.get配列値[]
hive> select  get_json_object(data, '$.store.fruit[0]') from test;
  :{"weight":8,"type":"apple"}