TIL_51. Project 5 (Dashboard)


2020. 12. 水曜日


まずAirbnbのデータを分解しました。

  • 人の希望事項は、ユーザーがサービスを利用するタイムスタンプがあれば良いということです.
  • 残念ながら希望事項で会いました.
  • この表に存在するColumnは、AirbnbのホストID、住所名、価格、ホスト開始日、スコア、地域などのサービス購入者ではなく、売り手中心の表である.
  • ユーザデータではありませんが、ホスト開始日とスコアデータが含まれているので、前回の項目とは異なる方向にダッシュボードを作成できます.
  • 指標が設定されています。

  • 優先スコアカードに含まれる指標が選択されています.
  • 寮数
  • ホスト数
  • 平均費用
  • 平均スコア
  • 最高格付け地域
  • 最大宿泊地域
  • には地域に関するデータも存在し、普段使いたい地図グラフを使うことができます.
  • 地区寮分布(地図図表)
  • 地図グラフの理解を助けるために、可視化されたエリア宿泊比率の円形グラフを追加します.
  • 各ホストのホスト開始日にはタイムスタンプがあるので、これらのデータを利用してトレンドマップを作成することができます.
  • ホスト増加傾向図
  • 標準の宿泊数と平均料金のグラフが追加されます.
  • 地区の寮数、平均費用
  • 建築タイプ寮数、平均費用
  • 部屋タイプ寮数、平均費用
  • スコアデータが存在するため、スコアチャートが追加されます.
  • 地区平均得点
  • 建築タイプ平均スコア
  • 部屋タイプ平均スコア
  • 対応する指標の元のデータを抽出した。

  • はまず加工されず、純粋なヌードデータのみを抽出した.
  • CREATE OR REPLACE TABLE `vaulted-cogency-295111.practice.airbnb_ny_dashboard` AS
    SELECT DISTINCT
      Host_Id,
      Host_Since,
      Name,
      Neighbourhood_,
      Property_Type,
      Review_Scores_Rating__bin_,
      Room_Type,
      Beds,
      Number_of_Records,
      Number_Of_Reviews,
      Price,
      Review_Scores_Rating,
      Zipcode
    FROM
      `untechbox-sql.airbnb.airbnb_ny`