Tableau9.0にて同フィールドに平仮名とカタカナが混在する場合、最初に読み込んだもので固定される件の回避方法


Tableau9.0において同じフィールドに平仮名やカタカナの表記ゆれがあった場合、最初に読み込まれたものが適用されます。

インプット例
kana1   kana2   num
でーたベース  データベーす  1
データベース  データベース  10
データベース  データベース  10
データベース  データベース  10
データベース  データベース  10

↓↓↓

読み込み結果
kana1   kana2   num
でーたベース  データベーす  1
でーたベース  データベーす  10
でーたベース  データベーす  10
でーたベース  データベーす  10
でーたベース  データベーす  10

なので、特に人が入力した文字を集計したりするときは最初の表記揺れが全て適用されてしまいます。

これを回避するには、データソース画面にて
取り込んだファイルの横から選択できる「ロケール」の設定を「英語(アメリカ合衆国)」などにするしかないようです。

読み込み結果(ロケール:英語(アメリカ合衆国)の場合)
kana1   kana2   num
でーたベース  データベーす  1
データベース  データベース  10
データベース  データベース  10
データベース  データベース  10
データベース  データベース  10

8.0, 8.1ではこの問題は発生しません。