2.2.1_Decision_Trees
[キーワード]
[学習内容]
複数の前処理を接続することで、冗長コードを最小限に抑えることができます
from sklearn.pipeline import make_pipeline
from sklearn.tree import DecisionTreeClassifier
ノードを分割する場合は、コスト関数を削減するために、分割の特性と分岐を見つける必要があります.
Genie不純度とエントロピー~不純度が低いほど値が低くなる
不純度:分割が良いほど値が低くなります
import graphviz
from sklearn.tree import export_graphviz
ツリーモデルの複雑さを低減し、オーバーフィットを低減
プライマリスーパーパラメータ
min samples split:各split結果の最小サンプル数を設定する
min samples leaf:エンドノード(外部ノード)に少なくとも存在する必要があるサンプル数
max depth:ブランチの深さを設定する
Reference
この問題について(2.2.1_Decision_Trees), 我々は、より多くの情報をここで見つけました https://velog.io/@winocas/bootcamp20テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol