Pythonを使用してデータを分析(13)

2398 ワード

主流データから各大陸beer servingsの平均、最小、最大、合計ストライプ図を描画
(1)beer servingsの統計を取得する
agg()関数は,グループの種々の演算結果を同時に得ることができる関数である.各大陸のビール消費の統計を取得するには、aggに取得したい統計パラメータを入力してナビゲートします.
drink_df.groupby('continent').beer_servings.agg(['mean', 'min', 'max', 'sum'])

(2)インデックス、ラベル、データ値リストの作成
beer_servings_table = drink_df.groupby('continent').beer_servings.agg(['mean', 'min', 'max', 'sum'])
beer_servings_table.index.to_list() #레이블 리스트(대륙이름)
beer_servings_table['mean'].to_list() #평균값 리스트
beer_servings_table['min'].to_list() #최솟값 리스트
beer_servings_table['max'].to_list() #최댓값 리스트
beer_servings_table['sum'].to_list() #합계값 리스트
import numpy as np
index = np.arange(len(beer_servings_table.index.to_list())) #대륙이름 리스트 카운트해서 인덱스 구하기
(3)大陸別平均/最大/最小/合計ビール消費量の棒グラフを描く
continents = beer_servings_table.index.to_list()
values = beer_servings_table['mean'].to_list()

plt.bar(index, values, width=0.2, color='g')
plt.xticks(index, continents)
plt.show()
continents = beer_servings_table.index.to_list()
values = beer_servings_table['max'].to_list()

plt.bar(index, values, width=0.2, color='r')
plt.xticks(index, continents)
plt.show()
continents = beer_servings_table.index.to_list()
values = beer_servings_table['min'].to_list()

plt.bar(index, values, width=0.2, color='b')
plt.xticks(index, continents)
plt.show()
continents = beer_servings_table.index.to_list()
values = beer_servings_table['sum'].to_list()

# y축 레이블과 바차트 제목 추가
plt.ylabel('beer_servings')
plt.title('beer_servings by continents')

plt.bar(index, values, width=0.2, color='y')
plt.xticks(index, continents)
plt.show()