文字列から数字だけを取り出す(例3years→3)→DataFrameの要素と置き換える


はじめに

この記事は数弱体質の体育大学生である私が、知りたかったことや躓いたところを書き留めておく備忘録です
間違いがあれば訂正をよろしくお願いします。

環境とか:windows10 python vscode

文字列から数字を取り出す

import re
re.sub(r"\D","","2years")

第一引数で文字列のうちで置換させたい場所を指定
→r"\D"は数字以外の部分を指定

第二引数で何に置換する指定
→今回は消すことが目的のため "" を書く。

第三引数で対象の文字列を指定

DataFrameの要素と置き換える

#空のリスト作成
import pandas as pd
k = []
#繰り返し処理でdata['col1']の置換を行いリストに入れる
for i in range(len(data['col1'])):
    j = data.iloc[i]['col1']
    k.append(re.sub(r"\D", "", j))


col1_new = pd.DataFrame({'col1_new':k})
data_new = pd.concat([data,col1_new],axis=1)

#変更前のデータを消去
data_new.drop(['col1'],axis=1)

最後に

不足している情報は私の学習進度に応じて追加していきます。