第5週のデータ分析実習課題


最初の週の優先パラメータは、
2週目のデフォルトコードは、
3週目numpy、
4週目アザラシ(可視化)、
5週目の実習課題!!
5週目の授業内容は,以前に学んだすべての内容を利用して,既存業界でデータ分析をどのように運用するかという実習課題である.
データには、広告データとショッピングモールの注文データの2つがあります.
広告データを利用してマーケティングデータ分析、顧客データ分析、検索広告データ分析を行い、ショッピングサイトの注文データを利用して販売分析、顧客嗜好分析、Push Novation時間の制定、ログデータで離脱ページ(漏斗分析)を把握した.
前に学んだことだけではついていけませんが、
以上のインターンシップを通じて、「もっと勉強すれば、実際の職場で会社のデータをどう利用するか」という感覚を見つけました.
実践の過程で、私たちは最も理解しているマーケティング分析と顧客データ分析を総括します.

1.マーケティングデータ分析


広告データから,マーケティングを利用したCTR,CPM,CPCなどを分析することができる.

CTR(Click Through Ratio)


aka. クリック率(計算:クリック数/露出回数x 100)
ページ広告のクリック率を表示
オンライン広告の効果を測定する重要な指標です.
[ネット韓国外国語大学ブログ出典]https://blog.naver.com/cufspr/222573171959

CPM(Cost Per Mile)


計算:(広告単価/広告露出回数)x 1000
広告費用を測定するために、Mileはラテン語で1000を表しています.主にゲーム業界でよく使われるモデルで、最近は主にスマートフォンのゲーム内の広告費用の測定モデルとして使われている.
[ネット韓国外国語大学ブログ出典]https://blog.naver.com/cufspr/222573171959

CPC(Csot Per Click)


計算:広告費用/クリック回数
クリックごとの料金!消費者は広告のクリックを見ると費用が発生し、主にNAVER、グーグルなどの検索メディアで使用される.
甲のマーケティングブログになる.
広告データのクリック数と料金により、前処理と計算により、クリック率と平均クリック料金を下図のように簡潔に表示できます.

広告キーワードでgroupby関数を使用してクリック率とクリック率を決定すると、どのキーワードに投資する必要があるかを決定する際に使用できます.

2.顧客データ分析


ある外国銀行で行った場外アンケートをもとに、作成したマーケティングデータで分析した.
先にデータをロードし、測定値が不足していることを確認した授業を通じて、測定値の確認はすべてのデータ分析の基礎であることを学ぶことができます.
#파일 read
df=pd.read_csv('bank_data/bank-additional-full.csv',
                 engine='python',sep=';')
#결측치 확인
df.isnull()

#결측치 열단위 확인
df.isnull().sum()

#결측치 행단위 확인
df.isnull().sum(axis=1)

以上の写真は10単位で欠測値の確認を行い、いずれの列にも欠測値がないことを確認できます.
以上のデータに基づいて「ローンを持っている人は銀行製品にうまく入れない」ということです.この仮定を検証する解析を行った.
まず,銀行製品に加入するか否かを基にyes,noの2つのグループに分け,そのグループが融資するか否かを基にyes,noを比較した.
<データの説明>
銀行製品に加入するかどうかを示すcolumnはy、valueはyes、noは2つです.
ローンに加入するかどうかを示す列はloanで、値はyes、no、unknowの3つです.
#은행 상품 가입 여부로 그룹화
grouped = df.groupby('y')
#은행 상품 가입여부로 그룹화된 데이터를가지고 yes데이터와 no데이터를 분리한다.
yes_group=grouped.get_group('yes')
no_group=grouped.get_group('no')
#yes그룹과 no그룹에서 대출여부를 확인한다.
yes = yes_group['loan'].value_counts()
no = no_group['loan'].value_counts()
#은행상품 가입여부에 따른 대출 상황을 보기좋게 백분위로 표현한다.
yes = yes/yes.sum()
no = no/no.sum()
#시리즈 혹은 데이터프레임을 결합하는 concat함수를 활용하여 yes, no그룹을 결합한다. (axis 설정 안하면 행단위 결합)
pd.concat([yes, no], axis=1)

要するに、銀行製品に加入している人のローン比重は、加入していない人のローンより0.005小さいことがわかります.
最後に...
今回のインターンシップで学んだラッパ分析と漏斗分析は、現在の業界では使用度が高いはずです.しかし、私の実力では、私の理解度はまだ悪いと思います.だから、もう少し勉強すべきだと思います.
初めて触れたデータ分析では、このようにデータを深く観察したり、現在の可用性を理解したりすることができ、今回の講座は本当に役に立つと思います.もちろん、コードから遠く離れていて、統計分析にふさわしくない私は、少し難しいように聞こえますが、この機会を通じて、データ分析に興味を持ち、自信を育てました.この授業は難しいので、他の授業はもっと簡単ではありませんか.