Minimzing Churn of Subscription Product through Analysis of Financial Habit


次はプロジェクトの進捗中の合成コードリンクです!!(説明もコメントで決めます~)
Jupyter Notebookを使用して作成したコードリンク!

概要


新しいプロジェクトを開始し、購読を最小限に抑えます.
以前のプロジェクトと同様に、ほとんどの会社は購読を最小限に抑えることを望んでいます.
サブスクリプションのキャンセルを避けるには、ユーザーのパターンを知る必要があります.
このモデルのtargetは회사의 구독 상품을 구독하고 있는 모든 고객です.
会社は私が働いているこのモデルの本当の価値をまだ知らないかもしれませんが、大きな価値を創造できると思います.
今回のプロジェクトの最終目標.
👍 해지할 가능성이 높은 유저를 예측해 이들이 재구독하는 데에 집중하는 것이라 할 수 있습니다.
これにより、お客様の製品のメリットを注意したり、興味のある製品を追加したりすることができます.

データの表示



データを振り返り、最も重要な特性を考えてみましょう.
  • ユーザ:ユーザ識別子
  • churn:離脱すなわち反応変数.この人は商品の購読をキャンセルしたのか、それともまだ購読中なのか...これは最新です.
  • 年齢:プレイヤー年齢
  • 住宅:カテゴリ変数には、na、R、oの3つのレベルがあります.居住状態の変数.
    R:住宅賃貸状態
    o:住宅を所有している状態
    na:居住状態データなし
  • credit score:信用点数のある人の点数
  • 預金:プレイヤーが自分の口座にお金を預けた回数
  • 退出:プレイヤーの出金回数
  • 購入:ユーザーが口座で消費した回数(会社が複数の協力店と契約し、ユーザーに割引を提供する)
    提携店の店舗で購入した回数
  • パートナー購入:ユーザーが口座で消費した回数(会社が複数のパートナーショップと契約し、ユーザーに割引を提供する)
    協力店で購入した回数
  • cc take:この機能を含め、ccに付属する列はクレジットカード商品と関係があります.
    同社は、ユーザーが自分の金融習慣に従ってクレジットカードを使用することを提案し、ユーザーに提案を受け入れたかどうかを通知することがある.
    ccが取得したユーザーが所有するクレジットカードの数.
  • cc推薦:クレジットカード推薦を受けた回数.
    この商品の多くの画面や機能で発生することをお勧めします.たとえば、個人情報を入力したり、特別割引ページに移動したりすると、財務習慣に基づいて推奨クレジットカードの画面が表示されます.
  • cc invoked:ユーザーがクレジットカードを拒否した回数.
  • cc like:ユーザーがクレジットカードを発行した回数.
  • ccアプリケーションbegin:クレジットカード申請を開始した回数.申請が完了したかどうか分かりません.
  • appダウンロード:アプリケーションをダウンロードするかどうか.(バイナリ変数)
  • web user:私たちのサイトを体験したことがありますか.(バイナリ変数)
  • app web user:appとwebが使用されているかどうか.(バイナリ変数)
  • ios user:iosユーザー(バイナリ変数)
  • android user:androidユーザー(バイナリ変数)
  • 登録電話:ユーザーが何台の携帯電話を登録したかを表示します.
  • payment type:ユーザーがお金を受け取る頻度.
    週に2回
    毎週
    半月:月2回
    月:月1回
    いいえ
  • 待機4 loan:ローンステータスがローンを待機していることを示します.
    このステータスは、保留中のローンを申請し、承認を待っている場合です.
  • loanのキャンセル:ユーザーが過去の任意の時点でローンをキャンセルしたことを示します.
    キャンセルされていない場合は0です.
  • 借款を受け取る:かつて借款したことがある1、なければ0
  • ローンを拒否:プレイヤーはローンを拒否したことがあります1、もしなかったら、0
    拒否されたローンは法的に承認されたが、ユーザーはローンの提案を拒否した.
  • 星座:
  • left for two mond plus:ユーザーが製品を使用して2ヶ月以上経ってから戻ってきた場合は、1、または0
  • です.
  • left for ont mont month:ユーザーが1ヶ月以上製品を使用していない後に戻ってきた場合は1、そうでない場合は024579182です.
  • 奨励金稼ぎ:プレイヤーが獲得したポイントを表示します.
    どの商品にも様々な補償オプションがあり、良い金融習慣に対応しています.その行動によってポイントを得る.
  • is reference:ユーザーが他の人に推薦されたかどうか.
    友人または家族に特定の推奨コードを推奨すると、このトピックに表示されます.
  • プロジェクトプロセス


  • 1.EDAと前処理


    Removing NAN
    Histogram
    Pie chart of binary feature
    Correlation

  • 2.モデルの作成


    One-hot encoding
    Balancing the training set
    Feature Scailing
    K-Fold Cross Validation
    Analyzing Coefficients
    Feature Selection
  • 3.完成モデル


    user、y test、y predを揃えてマッチングを完了

    の最後の部分


    複数のモデルを構築し,モデル構築過程におけるすべての類似点を理解したが,EDAは常に変化しているようであった.これは、データの構造化方式が変わったためかもしれません.balancing the training set部分も最初に確定した概念で、他のプロジェクトを試してみるべきだと思います.
    最後に,feature selectionにより,40個の特徴のうち20個(すなわち半分減少)の結果を比較し,重みと予測性を有する変数名の大部分を一致させた.この過程で,Analyzing Coefficientsを行い,重要なcoefを抽出し,これらの情報を確認した.
    精度は62%であった.これは影響の小さいモデルかもしれないが,浄化されていない真のデータを用いて不要な特徴を排除し,アンバランスな反応変数を完全に予測することは困難である.
    62%の精度を持つモデルはよくないわけにはいかない.しかし、パフォーマンスを向上させる方法を探し続ける必要があります.反応変数に時間制限を導入すると精度が向上する可能性がある.
    このプロジェクトでは、ユーザーがいつ終了するかは予測されていません.
    一日なのか、一ヶ月なのか、一年後なのか、残っています.これは、実際の予測が正しいかどうかを検証することはほとんど不可能です.
    本プロジェクトの目的は、ユーザーが終了するフィールドを探索することです.
    このモデルは依然としてよく利用できます.これは、製品が廃棄される可能性がある人を少しでも識別できるからです.これにより、興味を失ったユーザーに新しい機能が提供されます.
    新しい製品または製品機能がある場合、このプロジェクトのモデルが破損する可能性が低いユーザーを予測します.