アナスダンOSダディ - リオデジャネイロ


<研究ノート>第二次大戦後におけるドジョウの研究 - リオデジャネイロ.Nesse Post , Quero Mostrar um Pulco como "Faiita uma an "de se dadosエスペロ・・・
クラロque comoボアコリオカEscolhi Os Dadosは、MEU RJ RSをします

<研究ノート> E . C . C . A . A . Airbnb , Saiba que a Espresena s Vol Ver Ganhando O Cora - Plavureo O Dos Viajantes , Mas Coco Voc
<研究ノート>リオス・パラグラフとしてのリオ・パラオについて
Airbnb peroite Aoos Indivは、duos alugar todo - ou parte de sua prを引きます.Busca e Reservasのサイトには、Pessoa que Oferece a acomodaがある.

VAMOSパラシュートとしてのパラシュート



vamosは、ar ar pelo nosso cl - is ssssico import de Bibliotecas、Aqui como vamos fazer apenas uma - one - se - se se se lise、acaba que n - temo o temos muitas - obbliotecas para import、mas espera s var vir post de projetos de machineを学習する
!pip install missingno 

# importar os pacotes necessários
%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import missingno as msno  

# configurar as visualizações
sns.set_style('darkgrid')
sns.set_palette('Accent')
アリエムシーマタームは、m fiz o ...Colunas com Dados FaltantesがNoSSOデータセットを行うとして、PiP de Da Biblioteca que iRemos by Visualizar , Atrav - es de um Gr . Fico畝
o PRは、Ximo Passoをします.
como temos um arquivo csv,vamosの有用性o pdReadRank CSV , como mostro abaixo :
# obtendo os dados
data_path = 'http://data.insideairbnb.com/brazil/rj/rio-de-janeiro/2020-04-20/visualisations/listings.csv'

df = pd.read_csv(data_path)
df.head()
アルのm disso、como a楽しい傷.5つのprimeiras linhasとしてconseguimos mostrasはnosso dataframeを行う.Coco Vocは、クィーラMostrarマリスque 5 linhas、basta colocarのQuantidadeデlinhas dentro dos parが、nteesになります.

アルゴque gostoデacrescentarのnos projetosは、didiconを得ます.エレNosディZ o queは、Cada variをベルで運びます.Isosoは、Timo para Conhecermos Melhor os nossos dados e com certeza vai nosアジャダールNASを意味します.

アールズリゼ探検家アリアデダドス


Nense Projeto EUフィズ馬sは、eの上で、e e c c o digosです.naはpoa、eu estava iniciandoのos estudos e fazer isso私にajudou bastante a entender umのporco comoのumaのanのlise deve ser feito,quais respostas eu devo trazer ao projeto

Quantos Atributos / Vari - Le Vis / colunas e Quantas Enteradas / Linhas Possui O Nosso Dataframe ?


print('DIMENSÕES DO DATAFRAME:')
print(f'Linhas:  {df.shape[0]}')
print(f'Colunas:  {df.shape[1]}')
oRootNameは、次元を計算します.( linhas , colunas )
アペッサーO Primeiro Elememento Desa Tupla EU利用法〔0〕Eパラシュート形状

Daos ( Dtypes ) das nossas vari - en - veisのQuais s ' s o os tipos de dados


df.dtypes
df.dtypes.value_counts()
所有者.Dtypes Retorna馬sは、DeデCada Colunaをre com o tiposにします.

se voc saber quantas colunas de cada tipo de dados esse dataframe possui e n o o o o ficar contando na m o o o,o mを使ってください.valueound count ()

Nosso Dataset Possui Valore Ausentes


df.isna().any()
df.isna().sum() 

# visualização das entradas de cada coluna
msno.bar (df, figsize = (10,5));

#eliminando a colunaneighbourhood_group
df.drop('neighbourhood_group', axis=1, inplace=True)
パラ「ペルガンタール」AO dataframe seは、アルゴルcoluna com Valor Nan、Utilizamos Oを示します.isna ()とにかく.本当のouは、パラシュートで降下します.

Eパラシュートで降下する人QuantosヴァレレスAusentes cada coluna possui、Utilizamos.isna ()umm ()

Limbra da Biblioteca missingno que import?耳鼻咽喉科では、Ea - no s traz mis - uma forma de visualizar os dados faltantes de cada coluna

コモVIVO Thoriormente、nossoデータセットpossui 35.870 entradas.Analisando OS VALLES Ausentes no comcoman前ノタマズVariの外のVELのVi隣人グループn n o o tem dadosSendo Asym、Elan - o o acacentarは、nada na nssaに言及します.Ellipineiエサvariは、ベルをdataframeをします.

ヒストグラマダスvari


<研究ノート>ヒストグラーマの意味
ヒストグラマ,タム・プ・ム・コン・コンハード・コモディストリビューションSE vocは、レンタカーエンターラーMelhor Sobre、clique aqui .
# análise visual das variáveis númericas através de um gráfico de frequências (histogramas)
df.hist(bins=15, figsize=(15,10));

Notamos que h hは、nnicos da presenesを解放します.<研究ノート>第一次世界大戦における視覚障害者の視覚的視座

ディテリアス


# visualizando um resumo estatístico das variáveis númericas
df[['price', 'minimum_nights', 'number_of_reviews',      'reviews_per_month', 'calculated_host_listings_count', 'availability_365']].describe().round(2)
Ese mは、todo traz muitas informaによって、One関係を示します.como mは、di das colunas、o valor mを得ます.

Pontos Polipais da an Le se se feita atrav s s m m to todo description :
  • VOR or Mr . nimo da variは、Ver価格0
  • Volor m ' s Ximo da Variは、ヴェル価格は131.727
  • o valor m ' sキシモda variは、ヴェルMumumumague夜1.123
  • Volor m ' s Ximo da vari - en - vel計算されたホスト名
  • Boxplot das Variは、可能性のある可能性を持つ


    Em Estatは、Stica Gentiva、diagramaデcaixa、diagramaデ極値e quartis、Boxplot ouボックスプロットを示します.Wikipédia

    Boxplot da variは、ベルを引きます


    plt.figure(figsize=(15,3))
    sns.boxplot(data=df, x='minimum_nights')
    plt.title('Boxplot minimum_nights')
    plt.show() 
    
    # ver quantidade de valores acima de 30 dias para minimum_nights
    print(f'[minimun_nights]\nValores acima de 30:{len(df[df.minimum_nights > 30])} entradas')
    
    print('Porcentagem: {:.4f}%'.format(len(df[df.minimum_nights > 30])/ len(df.minimum_nights)* 100))
    

    Temos 224 Enteradas com MinimumCone夜acimaデ30、o queは、0.62 %のDOSダドスに対応します.

    da variはベール価格


    plt.figure(figsize=(15,3))
    sns.boxplot(data=df, x='price')
    plt.title('Boxplot price')
    plt.show() 
    
    # ver quantidade de valores acima de 1500 para price
    print(f'[price]\nValores acima de 1500: {len(df[df.price > 1500])} entradas')
    print('Porcentagem: {:.4f}%'.format(len(df[df.price > 1500])/ len(df.price) * 100)
    

    Temos 3.360 entradas com価格acimaデ1.500、o queは9.36 %のdos dadosに対応します.

    ヒストグラマSEMアウトライアー


    デポイスデアイデンティフィクスOSアウトライザー、vamosプロッタnovamente oヒストグラパラVisualizarmos OSダドスLimpos.
    # histogramas com valores de minimum_nights menor que 30 e price menor que 1500
    df_clean = df.copy()
    df_clean = df_clean.query('minimum_nights < 30 & price < 1500')
    df_clean.hist(bins=15, figsize=(15,10));
    

    Vari - Ve Visとしての存在


    Clarela Present - o - a La a a a a a a a a a a a a a a a ' a a estat ' s Estat ' s stica entre duas vari - en veis .Vari - Le - Visを中心としたRela - Lesse - es - esとしてのSTOCOSパラ・メディ・メディック
    計算機o coeficienteデcorrelaは、o o comを楽しみます.COR ()
    IREE APRERENTAR EASA CORRERA POOTRAPH TO AMA MATRIZ E De Forma mais visual atrav es de um heat map ( Mapa de calor )
    corr = df_clean[['price', 'minimum_nights', 'number_of_reviews', 'reviews_per_month',
    'calculated_host_listings_count', 'availability_365']].corr() 
    
    #plotando a matriz de correlação
    sns.set_context("notebook", font_scale=1.0, rc={"lines.linewidth": 2.5})
    plt.figure(figsize=(10,5))
    
    #criando uma máscara para ver apenas os valores de correlação uma vez
    mask = np.zeros_like(corr)
    mask[np.triu_indices_from(mask, 1)] = True
    a = sns.heatmap(corr, mask=mask, annot=True, fmt='.2f')
    rotx = a.set_xticklabels(a.get_xticklabels(), rotation=90)
    roty = a.set_yticklabels(a.get_yticklabels(), rotation=30)
    

    <資料>ティポ・ド・ホスピタギズムについて


    # a quantidade de cada tipo de imóvel disponível
    df_clean['room_type'].value_counts() 
    
    # porcentagem de cada tipo de imóvel disponível
    df_clean['room_type'].value_counts() / len(df_clean)
    


    Qualalidade mais caraをqualというか?


    # média de preço do top 10 localidades mais caras
    df_clean.groupby('neighbourhood')['price'].mean().sort_values(ascending=False)[:10] 
    
    # contagem de imóveis por localidade
    df_clean['neighbourhood'].value_counts()
    

    <研究ノート>コウモリ・ポドモス・ヴァーロ・ポデモス・ヴァー・コンヴァード・ヴァイロス・コ・メイガ・イン・ヴェイス・ユルガドス,オーク・ガルドス著,『詩篇ロアリダイド』

    プラトンの緯度経度


    df_clean.plot(kind='scatter', x='longitude', y='latitude',
    
    alpha=0.4, c=df_clean['price'], s=8, cmap=plt.get_cmap('jet'),
    
    figsize=(12,8));
    

    は、

  • Aqui foi feita uma an se se se se se se se breの表面のsobre os dados disponはveis no arquivo citado foriororte .Para - uma - an - is - lise - maisは、recomendo que seja - itzazo o dataset que cont - m m mais vari - en veis/atributosを完成させます.
  • Conseguimosは、Volore Ausentes e outliers、fazer seu tratamento、plotamos alguns gr . ficosパラシュートで降下します.
  • projetoのgithubのリンクhttps://bit.ly/3fHgAzX
  • ProjetoのGoogle Colabのリンクhttps://bit.ly/3hQ18Da
  • 文脈

  • [ LinkedIn ] :
  • [ github ] :https://github.com/beatrizmaiads
  • [ Instagram ] :
  • [ dev . to ] :
  • [ミディアム]https://medium.com/@beatrizmaiads
  • 〔Eメール〕:[email protected]