Minimzing Churn of Subscription Product through Analysis of Financial Habit
次はプロジェクトの進捗中の合成コードリンクです!!(説明もコメントで決めます~)
Jupyter Notebookを使用して作成したコードリンク!
新しいプロジェクトを開始し、購読を最小限に抑えます.
以前のプロジェクトと同様に、ほとんどの会社は購読を最小限に抑えることを望んでいます.
サブスクリプションのキャンセルを避けるには、ユーザーのパターンを知る必要があります.
このモデルのtargetは
会社は私が働いているこのモデルの本当の価値をまだ知らないかもしれませんが、大きな価値を創造できると思います.
今回のプロジェクトの最終目標.
データを振り返り、最も重要な特性を考えてみましょう.ユーザ:ユーザ識別子 churn:離脱すなわち反応変数.この人は商品の購読をキャンセルしたのか、それともまだ購読中なのか...これは最新です. 年齢:プレイヤー年齢 住宅:カテゴリ変数には、na、R、oの3つのレベルがあります.居住状態の変数.
R:住宅賃貸状態
o:住宅を所有している状態
na:居住状態データなし
credit score:信用点数のある人の点数 預金:プレイヤーが自分の口座にお金を預けた回数 退出:プレイヤーの出金回数 購入:ユーザーが口座で消費した回数(会社が複数の協力店と契約し、ユーザーに割引を提供する)
提携店
パートナー購入:ユーザーが口座で消費した回数(会社が複数のパートナーショップと契約し、ユーザーに割引を提供する)
協力店で購入した回数
cc take:この機能を含め、ccに付属する列はクレジットカード商品と関係があります.
同社は、ユーザーが自分の金融習慣に従ってクレジットカードを使用することを提案し、ユーザーに提案を受け入れたかどうかを通知することがある.
ccが取得したユーザーが所有するクレジットカードの数.
cc推薦:クレジットカード推薦を受けた回数.
この商品の多くの画面や機能で発生することをお勧めします.たとえば、個人情報を入力したり、特別割引ページに移動したりすると、財務習慣に基づいて推奨クレジットカードの画面が表示されます.
cc invoked:ユーザーがクレジットカードを拒否した回数. cc like:ユーザーがクレジットカードを発行した回数. ccアプリケーションbegin:クレジットカード申請を開始した回数.申請が完了したかどうか分かりません. appダウンロード:アプリケーションをダウンロードするかどうか.(バイナリ変数) web user:私たちのサイトを体験したことがありますか.(バイナリ変数) app web user:appとwebが使用されているかどうか.(バイナリ変数) ios user:iosユーザー(バイナリ変数) android user:androidユーザー(バイナリ変数) 登録電話:ユーザーが何台の携帯電話を登録したかを表示します. payment type:ユーザーがお金を受け取る頻度.
週に2回
毎週
半月:月2回
月:月1回
いいえ
待機4 loan:ローンステータスがローンを待機していることを示します.
このステータスは、保留中のローンを申請し、承認を待っている場合です.
loanのキャンセル:ユーザーが過去の任意の時点でローンをキャンセルしたことを示します.
キャンセルされていない場合は0です. 借款を受け取る:かつて借款したことがある1、なければ0 ローンを拒否:プレイヤーはローンを拒否したことがあります1、もしなかったら、0
拒否されたローンは法的に承認されたが、ユーザーはローンの提案を拒否した.
星座: left for two mond plus:ユーザーが製品を使用して2ヶ月以上経ってから戻ってきた場合は、1、または0 です. left for ont mont month:ユーザーが1ヶ月以上製品を使用していない後に戻ってきた場合は1、そうでない場合は024579182です. 奨励金稼ぎ:プレイヤーが獲得したポイントを表示します.
どの商品にも様々な補償オプションがあり、良い金融習慣に対応しています.その行動によってポイントを得る.
is reference:ユーザーが他の人に推薦されたかどうか.
友人または家族に特定の推奨コードを推奨すると、このトピックに表示されます.
Removing NAN
Histogram
Pie chart of binary feature
Correlation
One-hot encoding
Balancing the training set
Feature Scailing
K-Fold Cross Validation
Analyzing Coefficients
Feature Selection
user、y test、y predを揃えてマッチングを完了
複数のモデルを構築し,モデル構築過程におけるすべての類似点を理解したが,EDAは常に変化しているようであった.これは、データの構造化方式が変わったためかもしれません.
最後に,
精度は62%であった.これは影響の小さいモデルかもしれないが,浄化されていない真のデータを用いて不要な特徴を排除し,アンバランスな反応変数を完全に予測することは困難である.
62%の精度を持つモデルはよくないわけにはいかない.しかし、パフォーマンスを向上させる方法を探し続ける必要があります.反応変数に時間制限を導入すると精度が向上する可能性がある.
このプロジェクトでは、ユーザーがいつ終了するかは予測されていません.
一日なのか、一ヶ月なのか、一年後なのか、残っています.これは、実際の予測が正しいかどうかを検証することはほとんど不可能です.
本プロジェクトの目的は、ユーザーが終了するフィールドを探索することです.
このモデルは依然としてよく利用できます.これは、製品が廃棄される可能性がある人を少しでも識別できるからです.これにより、興味を失ったユーザーに新しい機能が提供されます.
新しい製品または製品機能がある場合、このプロジェクトのモデルが破損する可能性が低いユーザーを予測します.
Jupyter Notebookを使用して作成したコードリンク!
概要
新しいプロジェクトを開始し、購読を最小限に抑えます.
以前のプロジェクトと同様に、ほとんどの会社は購読を最小限に抑えることを望んでいます.
サブスクリプションのキャンセルを避けるには、ユーザーのパターンを知る必要があります.
このモデルのtargetは
회사의 구독 상품을 구독하고 있는 모든 고객
です.会社は私が働いているこのモデルの本当の価値をまだ知らないかもしれませんが、大きな価値を創造できると思います.
今回のプロジェクトの最終目標.
👍 해지할 가능성이 높은 유저를 예측해 이들이 재구독하는 데에 집중하는 것이라 할 수 있습니다.
これにより、お客様の製品のメリットを注意したり、興味のある製品を追加したりすることができます.データの表示
データを振り返り、最も重要な特性を考えてみましょう.
R:住宅賃貸状態
o:住宅を所有している状態
na:居住状態データなし
提携店
외
の店舗で購入した回数協力店で購入した回数
同社は、ユーザーが自分の金融習慣に従ってクレジットカードを使用することを提案し、ユーザーに提案を受け入れたかどうかを通知することがある.
ccが取得したユーザーが所有するクレジットカードの数.
この商品の多くの画面や機能で発生することをお勧めします.たとえば、個人情報を入力したり、特別割引ページに移動したりすると、財務習慣に基づいて推奨クレジットカードの画面が表示されます.
週に2回
毎週
半月:月2回
月:月1回
いいえ
このステータスは、保留中のローンを申請し、承認を待っている場合です.
キャンセルされていない場合は0です.
拒否されたローンは法的に承認されたが、ユーザーはローンの提案を拒否した.
どの商品にも様々な補償オプションがあり、良い金融習慣に対応しています.その行動によってポイントを得る.
友人または家族に特定の推奨コードを推奨すると、このトピックに表示されます.
プロジェクトプロセス
1.EDAと前処理
Removing NAN
Histogram
Pie chart of binary feature
Correlation
2.モデルの作成
One-hot encoding
Balancing the training set
Feature Scailing
K-Fold Cross Validation
Analyzing Coefficients
Feature Selection
3.完成モデル
user、y test、y predを揃えてマッチングを完了
の最後の部分
複数のモデルを構築し,モデル構築過程におけるすべての類似点を理解したが,EDAは常に変化しているようであった.これは、データの構造化方式が変わったためかもしれません.
balancing the training set
部分も最初に確定した概念で、他のプロジェクトを試してみるべきだと思います.最後に,
feature selection
により,40個の特徴のうち20個(すなわち半分減少)の結果を比較し,重みと予測性を有する変数名の大部分を一致させた.この過程で,Analyzing Coefficients
を行い,重要なcoefを抽出し,これらの情報を確認した.精度は62%であった.これは影響の小さいモデルかもしれないが,浄化されていない真のデータを用いて不要な特徴を排除し,アンバランスな反応変数を完全に予測することは困難である.
62%の精度を持つモデルはよくないわけにはいかない.しかし、パフォーマンスを向上させる方法を探し続ける必要があります.反応変数に時間制限を導入すると精度が向上する可能性がある.
このプロジェクトでは、ユーザーがいつ終了するかは予測されていません.
一日なのか、一ヶ月なのか、一年後なのか、残っています.これは、実際の予測が正しいかどうかを検証することはほとんど不可能です.
本プロジェクトの目的は、ユーザーが終了するフィールドを探索することです.
このモデルは依然としてよく利用できます.これは、製品が廃棄される可能性がある人を少しでも識別できるからです.これにより、興味を失ったユーザーに新しい機能が提供されます.
新しい製品または製品機能がある場合、このプロジェクトのモデルが破損する可能性が低いユーザーを予測します.
Reference
この問題について(Minimzing Churn of Subscription Product through Analysis of Financial Habit), 我々は、より多くの情報をここで見つけました https://velog.io/@gydudsla12/Minimzing-Churn-of-Subscription-Product-through-Analysis-of-Financial-Habitテキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol