日本語フィールド名の扱いについて

1355 ワード

Splunk コロナウイルス Splunk テキストリンク

自分の地元のことを調べてみようと思って
県内の最新感染動向から新型コロナウイルス感染症対策　陽性患者数及び陽性患者の属性データのページのデータをダウンロードしてみたところ
文字コードがSJISexcel便利ですよね
nkfに通して nkf -w patient.csv > patient.csvでなんとかしたがフィールド名が日本語

| inputlookup patient.csv
| stats count by "居住地"
| rex field="居住地" mode=sed "s/神奈川県//"
| rex field="居住地" mode=sed "s/保健福祉事務所管内/市/"
| rex field="居住地" mode=sed "s/保健所管内//"
| eval featureId=case('居住地'="横浜市","横浜市中区",'居住地'="川崎市","川崎市幸区",'居住地'="相模原市","相模原市中央区",'居住地'="","県",true(),'居住地')
| fields - 居住地
| geom geo_kanagawa

このクエリーとみてもらえれば分かる通り

eval: '(シングルコーテーション)
rex: "(ダブルコーテーション)
その他: そのまま

というめんどくさい結果に
Splunkで扱う場合、UTF-8は必須だし、そのあといろいろと'"が必要があるので、持ってきた段階でフィールド名を変更したほうがいいと思います。

Author And Source

この問題について(日本語フィールド名の扱いについて), 我々は、より多くの情報をここで見つけました https://qiita.com/toshikawa/items/c5e6842fb12b92f433b5

著者帰属：元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。

Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .