日本語フィールド名の扱いについて


自分の地元のことを調べてみようと思って
県内の最新感染動向から新型コロナウイルス感染症対策 陽性患者数及び陽性患者の属性データのページのデータをダウンロードしてみたところ
文字コードがSJISexcel便利ですよね
nkfに通して nkf -w patient.csv > patient.csvでなんとかしたがフィールド名が日本語

| inputlookup patient.csv
| stats count by "居住地"
| rex field="居住地" mode=sed "s/神奈川県//"
| rex field="居住地" mode=sed "s/保健福祉事務所管内/市/"
| rex field="居住地" mode=sed "s/保健所管内//"
| eval featureId=case('居住地'="横浜市","横浜市中区",'居住地'="川崎市","川崎市幸区",'居住地'="相模原市","相模原市中央区",'居住地'="","県",true(),'居住地')
| fields - 居住地
| geom geo_kanagawa

このクエリーとみてもらえれば分かる通り

  • eval: '(シングルコーテーション)
  • rex: "(ダブルコーテーション)
  • その他: そのまま

というめんどくさい結果に
Splunkで扱う場合、UTF-8は必須だし、そのあといろいろと'"が必要があるので、持ってきた段階でフィールド名を変更したほうがいいと思います。