機械学習勉強記録 Pandasで重複する行を除外する
1 重複する行を消す .drop_duplicates()
データフレームの中で、重複したデータが入っている時に、それを簡単に削除する方法があります。
.drop_duplicates()
を使います。
df.drop_duplicates()
2 パラメータ
2.1 subset
subset
例えば、subset=['Name']
とすると、'Name'
の列で同じ要素を持った(二回目以降に同じ要素が出てきた)行が消えます。
2.2 keep
keep='last'
重複したもののなかでも、最後の一つだけを残して、他は全て消えます。
keep=False
重複したものは何も残らず、全て消えます。
Author And Source
この問題について(機械学習勉強記録 Pandasで重複する行を除外する), 我々は、より多くの情報をここで見つけました https://qiita.com/kino44/items/e8686a7940c8c45e721d著者帰属:元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。
Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .