K-Digital Training(ビッグデータ)30日目

5992 ワード

ソウル市の犯罪データと自動車データを分析した.

ソウル市犯罪データ分析

データ読み込み

import pandas as pd
# crime_df = pd.read_csv('../data/crimeSeoul.csv', encoding='cp949')
crime_df = pd.read_csv('../data/crimeSeoul.csv',sep=',',engine='python',encoding='euc-kr')

police_df = pd.read_csv('../data/police.csv', sep=',',engine='python',encoding='euc-kr')

必要なデータのみ取得

police_df1 = police_df[police_df['청'] == '서울청']

police_df1

館の署名欄を修正します.

nameresult = []
for temp in crime_df['관서명']:
    nameresult.append('서울'+ temp[:-1] + '경찰서')
crime_df['관서명'] = nameresult

地図を作成するために保存します.

crimepolicedf = crime_df

地区の交番の住所しか持ってこない.

gudata = []

for temp in crime_df['관서명']:
    gudata.append(police_df1.loc[police_df1['지구대파출소']==temp, :].주소.str.split(' ').values[0][0])

新造

口柱.

crime_df['구'] = gudata

資料型を変更します.

crime_df['절도 발생'] = crime_df['절도 발생'].str.replace(',','')
crime_df['절도 발생'] = crime_df['절도 발생'].astype('int')

crime_df['절도 검거'] = crime_df['절도 검거'].str.replace(',','')
crime_df['절도 검거'] = crime_df['절도 검거'].astype('int')

crime_df['폭력 발생'] = crime_df['폭력 발생'].str.replace(',','')
crime_df['폭력 발생'] = crime_df['폭력 발생'].astype('int')

crime_df['폭력 검거'] = crime_df['폭력 검거'].str.replace(',','')
crime_df['폭력 검거'] = crime_df['폭력 검거'].astype('int')

パケット加算は、

の組合せで行われる.

crime_df = crime_df.groupby('구').sum()

殺人が発生し、殺人検挙欄のみが保存される.

a = crime_df[['살인 발생','살인 검거']]

グラフを描くのに必要なものimport

import pandas as pd
import matplotlib.pyplot as plt
from matplotlib import font_manager, rc
import matplotlib
import platform
if platform.system() == 'Windows':
    matplotlib.rc('font', family='NanumGothic')
    #Malgun 
%matplotlib inline

の棒グラフ

を描画

a.plot(kind='bar', title='서울시 구별 살인 발생 및 검거 현황')

12.描画のためにx、y座標を地図に保存します.


xlist = []
ylist = []
for temp in crimepolicedf['관서명']:
    temp1 = police_df1.loc[police_df1['지구대파출소']==temp,:]['X좌표'].values[0]
    temp2 = police_df1.loc[police_df1['지구대파출소']==temp,:]['Y좌표'].values[0]

    xlist.append(temp1)
    ylist.append(temp2)
    
crimepolicedf['X좌표'] = xlist
crimepolicedf['Y좌표'] = ylist

の地図に描かれています.

import folium

center = [37.541 , 126.986]#지도의 중심을 넣어준다.
mapdata = folium.Map(location=center, zoom_start = 12)

for temp in crimepolicedf.index:
    folium.Circle(
        [crimepolicedf['Y좌표'][temp], crimepolicedf['X좌표'][temp]],
        radius = int(crimepolicedf.loc[temp,['범죄 합계']].values[0] / 5),color='#3185cc',fill_color='#3185cc'
        
    ).add_to(mapdata) #지도에 원을 다 더해라
mapdata

結果

じどうしゃぶんせき

データ読み込み

import pandas as pd

df = pd.read_csv('../data/auto-mpg.csv')


df = pd.read_csv('../data/auto-mpg.csv',header=None)

データ消去不要

df.drop(0, inplace=True)

列命名:ガソリン、シリンダ数、排気量、電力、車重、加速能力、発売年、メーカー、型番

df.columns=['연비','실린더수','배기량','출력','차중','가속능력','출시년도','제조국','모델명']

疑問符値を0に変更します.

df[(df['출력'] == '?')] = '0'

データ変換

df = df.astype({'출력':'float64','연비':'float64','실린더수':'int64','배기량':'float64','차중':'float64','가속능력':'float64','출시년도':'int64','제조국':int})

各種情報とarg用法

df.info()

df.describe()

df.count()

df.mean()

df['연비'].mean()

df[['연비','차중']].mean()

df.연비.median()

df.max()

df.std()

異常を処理する方法

#오류가나면 예외처리를 해준다.
for temp in df.columns:
    try:#밑에있는 코드가 문제없이 돌아가면 처리하고
        df[temp] = df[temp].str.replace('?','0')
    except:#오류나면
        print('오류났어요' + temp)

相関分析

df.corr() #상관관계 분석
#숫자끼리만 상관관계를 분석해준다.
#0에 가까울수록 상관관계가 없다.

ホットマップを使用して

を描画

import pandas as pd
import matplotlib.pyplot as plt
from matplotlib import font_manager, rc
import matplotlib
import platform
if platform.system() == 'Windows':
    matplotlib.rc('font', family='NanumGothic')
    #Malgun 
%matplotlib inline

import seaborn as sns
colormap = plt.cm.PuBu#컬러값을 지정해준다.
plt.figure(figsize=(10,8))
plt.title('자동차 상관관계 분석',y=1.05,size=15)
sns.heatmap(df.corr(),linewidths=0.1, vmax=1.0, square=True,cmap=colormap, linecolor='white',annot=True,annot_kws={"size":16})
#default는 cmap=colormap이걸 뺴야한다

Reference

この問題について(K-Digital Training(ビッグデータ)30日目), 我々は、より多くの情報をここで見つけました https://velog.io/@y7y1h13/K-디지털트레이닝빅데이터-30일차

テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。

Collection and Share based on the CC Protocol

django 011 | Form

[開発ログ]翌日スパルタコードクラブPython自楽-スクロールアクセルを保存しメールを送信[おしゃれな趣味コード]