[私もコードします]データ分析と可視化-Pandas 7

6720 ワード

15.Pandasテスト

  • 基本データ
  • import pandas as pd
    
    data = {
        '영화' : ['명량', '극한직업', '신과함께-죄와 벌', '국제시장', '괴물', '도둑들', '7번방의 선물', '암살'],
        '개봉 연도' : [2014, 2019, 2017, 2014, 2006, 2012, 2013, 2015],
        '관객 수' : [1761, 1626, 1441, 1426, 1301, 1298, 1281, 1270], # (단위 : 만 명)
        '평점' : [8.88, 9.20, 8.73, 9.16, 8.62, 7.64, 8.83, 9.10]
    }
    df = pd.DataFrame(data)
    df

    1)全てのデータに「ムービー」情報のみを出力する。

    df['영화']

    2)全てのデータに「ムービー」「スコア」情報を出力してください

    df[['영화', '평점']]

    3)2015年以降に公開される映画データに「映画」「公開年」を出力してください。

    df.loc[df['개봉 연도']>= 2015, ['영화', '개봉 연도']]# row=1, col=2

    4)与えられた計算式を参照して、「推奨スコア」Columnを追加します。

  • 推奨スコア=(視聴者数*スコア)/100
  • 例)最初の映画「鳴梁」について
  • 推薦点数=(観客数1761*採点8.88)/100=156
  • df['추천점수'] = df['관객 수'] * df['평점'] //100
    df

    5)全てのデータを「開封年」の降順で出力する

    df.sort_values('개봉 연도', ascending = False)