[Aiffel]Ipel 9日目コンセプトの整理と回顧
1.Irisデータセット利用
1) scikit-learn
X_train, X_test, y_train, y_test = train_test_split(data_feature, label, test_size, randomstate)
train_test_split
data feature:問題点、結果を生成するために入力
Label:モデルが満たさなければならない正しい値
✔✔✔🤔
Xデータセットを機械学習モデルに入力し,モデルから得られた予測結果を正解yと比較し,学習を行い,徐々に正確にする.
test size:テスト用データサイズ
random state:trainデータとtestデータの分離(分割)に適用されるランダム性を決定する
2) Iris Dataset
3)機械学習の概念
1.featureとlabel
リファレンス
11ランダム森林
Decision Treeの欠点を補うモデル
複数の決定ツリーを使用して結果を統合および予測
典型的な線形分類アルゴリズム
5. SGD (Stochastic Gradient Descent)
6. Logistic Regression
7.モデル評価方法
決定木でワインを分類する
ビート式Python機械学習付加問題
2.回顧
うまくいくかどうかわからない最後に乳がんのデータを分析するとき、あなたのモデルにはrecall値があります.調べてみると、ランダム森林でsgdを計算しました.交換してよかった.かなり高いrecall値も適当な結果になりましたか?問題の解き方が正しいかどうか分からないし、何も知らない.まず概念を確認し、学んだ内容によってここで終わります.
Reference
この問題について([Aiffel]Ipel 9日目コンセプトの整理と回顧), 我々は、より多くの情報をここで見つけました https://velog.io/@gongsam/Aiffel-아이펠-9일차-개념-정리-및-회고テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol