アナスダンOSダディ - リオデジャネイロ
13761 ワード
<研究ノート>第二次大戦後におけるドジョウの研究 - リオデジャネイロ.Nesse Post , Quero Mostrar um Pulco como "Faiita uma an "de se dadosエスペロ・・・
クラロque comoボアコリオカEscolhi Os Dadosは、MEU RJ RSをします
<研究ノート> E . C . C . A . A . Airbnb , Saiba que a Espresena s Vol Ver Ganhando O Cora - Plavureo O Dos Viajantes , Mas Coco Voc
<研究ノート>リオス・パラグラフとしてのリオ・パラオについて
Airbnb peroite Aoos Indivは、duos alugar todo - ou parte de sua prを引きます.Busca e Reservasのサイトには、Pessoa que Oferece a acomodaがある.
vamosは、ar ar pelo nosso cl - is ssssico import de Bibliotecas、Aqui como vamos fazer apenas uma - one - se - se se se lise、acaba que n - temo o temos muitas - obbliotecas para import、mas espera s var vir post de projetos de machineを学習する
o PRは、Ximo Passoをします.
como temos um arquivo csv,vamosの有用性o pdReadRank CSV , como mostro abaixo :
アルゴque gostoデacrescentarのnos projetosは、didiconを得ます.エレNosディZ o queは、Cada variをベルで運びます.Isosoは、Timo para Conhecermos Melhor os nossos dados e com certeza vai nosアジャダールNASを意味します.
Nense Projeto EUフィズ馬sは、eの上で、e e c c o digosです.naはpoa、eu estava iniciandoのos estudos e fazer isso私にajudou bastante a entender umのporco comoのumaのanのlise deve ser feito,quais respostas eu devo trazer ao projeto
アペッサーO Primeiro Elememento Desa Tupla EU利用法〔0〕Eパラシュート形状
se voc saber quantas colunas de cada tipo de dados esse dataframe possui e n o o o o ficar contando na m o o o,o mを使ってください.valueound count ()
Eパラシュートで降下する人QuantosヴァレレスAusentes cada coluna possui、Utilizamos.isna ()umm ()
Limbra da Biblioteca missingno que import?耳鼻咽喉科では、Ea - no s traz mis - uma forma de visualizar os dados faltantes de cada coluna
コモVIVO Thoriormente、nossoデータセットpossui 35.870 entradas.Analisando OS VALLES Ausentes no comcoman前ノタマズVariの外のVELのVi隣人グループn n o o tem dadosSendo Asym、Elan - o o acacentarは、nada na nssaに言及します.Ellipineiエサvariは、ベルをdataframeをします.
<研究ノート>ヒストグラーマの意味
ヒストグラマ,タム・プ・ム・コン・コンハード・コモディストリビューションSE vocは、レンタカーエンターラーMelhor Sobre、clique aqui .
Notamos que h hは、nnicos da presenesを解放します.<研究ノート>第一次世界大戦における視覚障害者の視覚的視座
Pontos Polipais da an Le se se feita atrav s s m m to todo description : VOR or Mr . nimo da variは、Ver価格0 Volor m ' s Ximo da Variは、ヴェル価格は131.727 o valor m ' sキシモda variは、ヴェルMumumumague夜1.123 Volor m ' s Ximo da vari - en - vel計算されたホスト名
Em Estatは、Stica Gentiva、diagramaデcaixa、diagramaデ極値e quartis、Boxplot ouボックスプロットを示します.Wikipédia
Temos 224 Enteradas com MinimumCone夜acimaデ30、o queは、0.62 %のDOSダドスに対応します.
Temos 3.360 entradas com価格acimaデ1.500、o queは9.36 %のdos dadosに対応します.
デポイスデアイデンティフィクスOSアウトライザー、vamosプロッタnovamente oヒストグラパラVisualizarmos OSダドスLimpos.
Clarela Present - o - a La a a a a a a a a a a a a a a a ' a a estat ' s Estat ' s stica entre duas vari - en veis .Vari - Le - Visを中心としたRela - Lesse - es - esとしてのSTOCOSパラ・メディ・メディック
計算機o coeficienteデcorrelaは、o o comを楽しみます.COR ()
IREE APRERENTAR EASA CORRERA POOTRAPH TO AMA MATRIZ E De Forma mais visual atrav es de um heat map ( Mapa de calor )
<研究ノート>コウモリ・ポドモス・ヴァーロ・ポデモス・ヴァー・コンヴァード・ヴァイロス・コ・メイガ・イン・ヴェイス・ユルガドス,オーク・ガルドス著,『詩篇ロアリダイド』
Aqui foi feita uma an se se se se se se se breの表面のsobre os dados disponはveis no arquivo citado foriororte .Para - uma - an - is - lise - maisは、recomendo que seja - itzazo o dataset que cont - m m mais vari - en veis/atributosを完成させます. Conseguimosは、Volore Ausentes e outliers、fazer seu tratamento、plotamos alguns gr . ficosパラシュートで降下します. projetoのgithubのリンクhttps://bit.ly/3fHgAzX ProjetoのGoogle Colabのリンクhttps://bit.ly/3hQ18Da [ LinkedIn ] :
[ github ] :https://github.com/beatrizmaiads
[ Instagram ] :
[ dev . to ] :
[ミディアム]https://medium.com/@beatrizmaiads
〔Eメール〕:[email protected]
クラロque comoボアコリオカEscolhi Os Dadosは、MEU RJ RSをします
<研究ノート> E . C . C . A . A . Airbnb , Saiba que a Espresena s Vol Ver Ganhando O Cora - Plavureo O Dos Viajantes , Mas Coco Voc
<研究ノート>リオス・パラグラフとしてのリオ・パラオについて
Airbnb peroite Aoos Indivは、duos alugar todo - ou parte de sua prを引きます.Busca e Reservasのサイトには、Pessoa que Oferece a acomodaがある.
VAMOSパラシュートとしてのパラシュート
vamosは、ar ar pelo nosso cl - is ssssico import de Bibliotecas、Aqui como vamos fazer apenas uma - one - se - se se se lise、acaba que n - temo o temos muitas - obbliotecas para import、mas espera s var vir post de projetos de machineを学習する
!pip install missingno
# importar os pacotes necessários
%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import missingno as msno
# configurar as visualizações
sns.set_style('darkgrid')
sns.set_palette('Accent')
アリエムシーマタームは、m fiz o ...Colunas com Dados FaltantesがNoSSOデータセットを行うとして、PiP de Da Biblioteca que iRemos by Visualizar , Atrav - es de um Gr . Fico畝o PRは、Ximo Passoをします.
como temos um arquivo csv,vamosの有用性o pdReadRank CSV , como mostro abaixo :
# obtendo os dados
data_path = 'http://data.insideairbnb.com/brazil/rj/rio-de-janeiro/2020-04-20/visualisations/listings.csv'
df = pd.read_csv(data_path)
df.head()
アルのm disso、como a楽しい傷.5つのprimeiras linhasとしてconseguimos mostrasはnosso dataframeを行う.Coco Vocは、クィーラMostrarマリスque 5 linhas、basta colocarのQuantidadeデlinhas dentro dos parが、nteesになります.アルゴque gostoデacrescentarのnos projetosは、didiconを得ます.エレNosディZ o queは、Cada variをベルで運びます.Isosoは、Timo para Conhecermos Melhor os nossos dados e com certeza vai nosアジャダールNASを意味します.
アールズリゼ探検家アリアデダドス
Nense Projeto EUフィズ馬sは、eの上で、e e c c o digosです.naはpoa、eu estava iniciandoのos estudos e fazer isso私にajudou bastante a entender umのporco comoのumaのanのlise deve ser feito,quais respostas eu devo trazer ao projeto
Quantos Atributos / Vari - Le Vis / colunas e Quantas Enteradas / Linhas Possui O Nosso Dataframe ?
print('DIMENSÕES DO DATAFRAME:')
print(f'Linhas: {df.shape[0]}')
print(f'Colunas: {df.shape[1]}')
oRootNameは、次元を計算します.( linhas , colunas )アペッサーO Primeiro Elememento Desa Tupla EU利用法〔0〕Eパラシュート形状
Daos ( Dtypes ) das nossas vari - en - veisのQuais s ' s o os tipos de dados
df.dtypes
df.dtypes.value_counts()
所有者.Dtypes Retorna馬sは、DeデCada Colunaをre com o tiposにします.se voc saber quantas colunas de cada tipo de dados esse dataframe possui e n o o o o ficar contando na m o o o,o mを使ってください.valueound count ()
Nosso Dataset Possui Valore Ausentes
df.isna().any()
df.isna().sum()
# visualização das entradas de cada coluna
msno.bar (df, figsize = (10,5));
#eliminando a colunaneighbourhood_group
df.drop('neighbourhood_group', axis=1, inplace=True)
パラ「ペルガンタール」AO dataframe seは、アルゴルcoluna com Valor Nan、Utilizamos Oを示します.isna ()とにかく.本当のouは、パラシュートで降下します.Eパラシュートで降下する人QuantosヴァレレスAusentes cada coluna possui、Utilizamos.isna ()umm ()
Limbra da Biblioteca missingno que import?耳鼻咽喉科では、Ea - no s traz mis - uma forma de visualizar os dados faltantes de cada coluna
コモVIVO Thoriormente、nossoデータセットpossui 35.870 entradas.Analisando OS VALLES Ausentes no comcoman前ノタマズVariの外のVELのVi隣人グループn n o o tem dadosSendo Asym、Elan - o o acacentarは、nada na nssaに言及します.Ellipineiエサvariは、ベルをdataframeをします.
ヒストグラマダスvari
<研究ノート>ヒストグラーマの意味
ヒストグラマ,タム・プ・ム・コン・コンハード・コモディストリビューションSE vocは、レンタカーエンターラーMelhor Sobre、clique aqui .
# análise visual das variáveis númericas através de um gráfico de frequências (histogramas)
df.hist(bins=15, figsize=(15,10));
Notamos que h hは、nnicos da presenesを解放します.<研究ノート>第一次世界大戦における視覚障害者の視覚的視座
ディテリアス
# visualizando um resumo estatístico das variáveis númericas
df[['price', 'minimum_nights', 'number_of_reviews', 'reviews_per_month', 'calculated_host_listings_count', 'availability_365']].describe().round(2)
Ese mは、todo traz muitas informaによって、One関係を示します.como mは、di das colunas、o valor mを得ます.Pontos Polipais da an Le se se feita atrav s s m m to todo description :
Boxplot das Variは、可能性のある可能性を持つ
Em Estatは、Stica Gentiva、diagramaデcaixa、diagramaデ極値e quartis、Boxplot ouボックスプロットを示します.Wikipédia
Boxplot da variは、ベルを引きます
plt.figure(figsize=(15,3))
sns.boxplot(data=df, x='minimum_nights')
plt.title('Boxplot minimum_nights')
plt.show()
# ver quantidade de valores acima de 30 dias para minimum_nights
print(f'[minimun_nights]\nValores acima de 30:{len(df[df.minimum_nights > 30])} entradas')
print('Porcentagem: {:.4f}%'.format(len(df[df.minimum_nights > 30])/ len(df.minimum_nights)* 100))
Temos 224 Enteradas com MinimumCone夜acimaデ30、o queは、0.62 %のDOSダドスに対応します.
da variはベール価格
plt.figure(figsize=(15,3))
sns.boxplot(data=df, x='price')
plt.title('Boxplot price')
plt.show()
# ver quantidade de valores acima de 1500 para price
print(f'[price]\nValores acima de 1500: {len(df[df.price > 1500])} entradas')
print('Porcentagem: {:.4f}%'.format(len(df[df.price > 1500])/ len(df.price) * 100)
Temos 3.360 entradas com価格acimaデ1.500、o queは9.36 %のdos dadosに対応します.
ヒストグラマSEMアウトライアー
デポイスデアイデンティフィクスOSアウトライザー、vamosプロッタnovamente oヒストグラパラVisualizarmos OSダドスLimpos.
# histogramas com valores de minimum_nights menor que 30 e price menor que 1500
df_clean = df.copy()
df_clean = df_clean.query('minimum_nights < 30 & price < 1500')
df_clean.hist(bins=15, figsize=(15,10));
Vari - Ve Visとしての存在
Clarela Present - o - a La a a a a a a a a a a a a a a a ' a a estat ' s Estat ' s stica entre duas vari - en veis .Vari - Le - Visを中心としたRela - Lesse - es - esとしてのSTOCOSパラ・メディ・メディック
計算機o coeficienteデcorrelaは、o o comを楽しみます.COR ()
IREE APRERENTAR EASA CORRERA POOTRAPH TO AMA MATRIZ E De Forma mais visual atrav es de um heat map ( Mapa de calor )
corr = df_clean[['price', 'minimum_nights', 'number_of_reviews', 'reviews_per_month',
'calculated_host_listings_count', 'availability_365']].corr()
#plotando a matriz de correlação
sns.set_context("notebook", font_scale=1.0, rc={"lines.linewidth": 2.5})
plt.figure(figsize=(10,5))
#criando uma máscara para ver apenas os valores de correlação uma vez
mask = np.zeros_like(corr)
mask[np.triu_indices_from(mask, 1)] = True
a = sns.heatmap(corr, mask=mask, annot=True, fmt='.2f')
rotx = a.set_xticklabels(a.get_xticklabels(), rotation=90)
roty = a.set_yticklabels(a.get_yticklabels(), rotation=30)
<資料>ティポ・ド・ホスピタギズムについて
# a quantidade de cada tipo de imóvel disponível
df_clean['room_type'].value_counts()
# porcentagem de cada tipo de imóvel disponível
df_clean['room_type'].value_counts() / len(df_clean)
Qualalidade mais caraをqualというか?
# média de preço do top 10 localidades mais caras
df_clean.groupby('neighbourhood')['price'].mean().sort_values(ascending=False)[:10]
# contagem de imóveis por localidade
df_clean['neighbourhood'].value_counts()
<研究ノート>コウモリ・ポドモス・ヴァーロ・ポデモス・ヴァー・コンヴァード・ヴァイロス・コ・メイガ・イン・ヴェイス・ユルガドス,オーク・ガルドス著,『詩篇ロアリダイド』
プラトンの緯度経度
df_clean.plot(kind='scatter', x='longitude', y='latitude',
alpha=0.4, c=df_clean['price'], s=8, cmap=plt.get_cmap('jet'),
figsize=(12,8));
は、
文脈
Reference
この問題について(アナスダンOSダディ - リオデジャネイロ), 我々は、より多くの情報をここで見つけました https://dev.to/beatrizmaiads/analisando-os-dados-do-airbnb-rio-de-janeiro-5-549hテキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol