pandasひらがな→カタカナ変換
pandasを利用してCSVを編集する場合、特定の列全体の値を変換したいです。
ネット上で調べて半角文字→全角文字へ変更する処理がありますが、ひらがな→カタカナ変換する処理が見つかりませんでした。
changeKanaのメソッドを作って、maketrans経由でchangeKanaを呼ぶように実装しました。
df = pandas.read_csv(file, encoding='cp932', engine='python', dtype=object)
半角→全角
df[列名] = df[列名].str.translate(str.maketrans({chr(0x0021 + i): chr(0xFF01 + i) for i in range(94)}))
ひらがな→カタカナ
df[列名] = df[列名].str.translate(str.maketrans({chr(x):changeKana(chr(x)) for x in range(12353, 12436)}))
# パターン1:半角→全角
# パターン2:ひらがな→カタカナ
def changeKana(in_Word):
# 本当は半角→全角の変更は不要
changeWord = jaconv.h2z(in_Word)
changeWord = jaconv.hira2kata(changeWord)
return changeWord
Author And Source
この問題について(pandasひらがな→カタカナ変換), 我々は、より多くの情報をここで見つけました https://qiita.com/Chenwf/items/abf1712ec4fafcdc5ed9著者帰属:元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。
Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .