GBMアルゴリズム
boostingはどのように動作しますか?
Boostingは一連の弱い学習因子(weak learners)を結合して全体モデルの予測精度を向上させることができる.任意の時間tにおいて、t−1の時点で得られた結果に基づいて、現在の結果に重みを与える.以前に正確に予測した結果はより小さな重みを得,誤って分類した結果はより大きな重みを得た.回帰問題の処理方法も似ている.
GBMパラメータ
総じて、GBMのパラメータは、以下の3つに分類することができる.ツリーパラメータ:モデル内の各決定ツリーの性質を調整する Boostingパラメータ:調整モデルにおけるboostingの動作 その他のモデルパラメータ:モデル全体の各動作を調整する 簡単なGBM二分類疑似コード:
パラメータの一般的な方法
前に述べたように、私たちが調整するパラメータは2種類あります.ツリーパラメータとboostingパラメータです.learning rateには特別な調節方法はありません.私たちが訓練した木が十分であれば、learning rateはいつも小さい値がいいからです.
ツリーの増加を決定するにつれてGBMが明らかに過度にフィットすることはなく、高learing rateはこの問題を引き起こすが、learning rateをひたすら減少させ、ツリーを増やすと、計算が非常に高価になり、長時間実行する必要がある.相対的に少し高いlearning rateを選択します.一般的なデフォルト値は0.1ですが、異なる問題に対して、0.05から0.2の間に があります.は、現在のlearning rateの下で最適な決定ツリーの数を決定する.その値は40~70の間でなければなりません.コンピュータが迅速に動作する値を選択してください.その後、これらのツリーは多くのテストとパラメータ を調整するために使用されます.は次に、learning rateおよびツリーの数を調整するためにツリーパラメータを調整する.決定ツリー を定義するために異なるパラメータを選択することができる. learning rateを低減するとともに、対応する決定ツリーの数を増加させ、モデルをより安定化させる .
Boostingは一連の弱い学習因子(weak learners)を結合して全体モデルの予測精度を向上させることができる.任意の時間tにおいて、t−1の時点で得られた結果に基づいて、現在の結果に重みを与える.以前に正確に予測した結果はより小さな重みを得,誤って分類した結果はより大きな重みを得た.回帰問題の処理方法も似ている.
GBMパラメータ
総じて、GBMのパラメータは、以下の3つに分類することができる.
1.
2. :
2.1 ( )
2.2
2.3
2.4
3.
パラメータの一般的な方法
前に述べたように、私たちが調整するパラメータは2種類あります.ツリーパラメータとboostingパラメータです.learning rateには特別な調節方法はありません.私たちが訓練した木が十分であれば、learning rateはいつも小さい値がいいからです.
ツリーの増加を決定するにつれてGBMが明らかに過度にフィットすることはなく、高learing rateはこの問題を引き起こすが、learning rateをひたすら減少させ、ツリーを増やすと、計算が非常に高価になり、長時間実行する必要がある.