ベージュ非機械学習モデル
機械学習目標
モデル作成後のパラメータの剛性を調整してデータ分布を間接的に表す
モデル表現の確率分布をデータの実際の分布に近づける最適なパラメータ値を検索
機械学習なし
データ学習パラメータ空間による確率分布
モデルパラメータを固定値ではなく不確実性を持つ確率変数と見なす
データを観察し、更新値を表示します.
確率変数のモデルパラメータ
R^2空間のすべての点(a,b)は、最初の関数y=ax+bを一意に決定するので、この空間のすべての点は、最初の関数からなる関数空間の異なる要素に対応する.
パラメータ空間
- 평균이 (1,0)인 정규분포
- a와 b의 값이 1과 0에 가깝다
Posteror、Prior、Likelihoodの関係
定義:prior分布を固定し、与えられたパラメータ分布からデータ状態が良好かどうかの値を計算する
式:パラメータ分布が決定されると、xというデータの確率が観察されます.
機能:
- θ에 의해 결정되는 함수라서 가능도 함수를 L(θ∣x)라고도 표현
- likelihood가 높다는 것은 파라미터 조건에 지정한 데이터가 관측될 확률 높음
定義:データを観察して計算する確率
特徴:直接計算、最適化θ検索値ではなく、数式が変形した後に数式を最大化するパラメータです.θ 検索
最大リアクティブ確率推定(MAP):最大化リアクティブ確率方向にモデルを学習する
説明:
- 정확한 확률 분포 알 수 없어서 posteriror의 값을 직접 구함 X
Likelihoodと機械学習
リンクテキスト
0.Preview
有限パラメータで実際の分布を近似する
100%正確ではない
入力データ~>予測出力データと実値との誤差
原因:データにノイズが発生しているためです.
モデル:線形モデルy=θ^⊤ * x
出力値の分布:モデルの予測値にノイズ分布を加える
ざつおんぶんぷ
- 평균: 0
標準偏差:σ
出力値の分布:
- 평균: θ^⊤ * xn
- 표준편차: σ
- p(y)추가: 출력값 분포 나타냄
MLE
モデルパラメータ:θ
データポイント(xn,yn)
良いモデルは、すべてのデータポイントの尤度値を大きくすることができます.
:データ点は互いに独立しており、確率分布は同じ(i.i.d)
: likelihood p(Y∣θ,X)各データ点の尤度を乗じる.
log likelionのパラメータではなくlog likelionを最大化することを求めます
- 로그의 성질이용( 곱셈 연산이 덧셈으로 바뀌어 미분 계산 편리)
- likelihood값이 0에 가까워지고 이 수들 곱하면 CPU연산이 불가하여 언더플로우 발생하는 문제를 해결해줌
- 로그함수는 단조증가이므로 likelihood를 최대화하는 파라미터와 log likelihood를 최대화하는 파라미터 값이 같아서 학습 결과에 영향을 주지 않음
- 로그 계산식
MLEの最優秀解を求めます
MAP
MLモデルの最適パラメータを探す方法
p(θ∣X)確率値を最大化するパラメータθ検索
パイロット分布の出現
背景:線形回帰問題ではMLEの依存性が強い(利点はあるがノイズが大きい場合,異常データはモデルの安定性を低下させる)
機能:
- 관찰된 데이터가 없을 때 파라미터 공간에 주어진 확률 분포
負のlogの後で誤差の最小化のパラメータを求めます
- 미분
MAP最適パラメータ
MAP as L 2正規化(最小二乗法の正規化)
損失関数にパラメータサイズに関する式を追加するには
->過度な継ぎ手は避ける
平均(0,0)正規分布!
0に近い学習
MAPコード
リンクテキスト
Reference
この問題について(ベージュ非機械学習モデル), 我々は、より多くの情報をここで見つけました https://velog.io/@qsdcfd/베이지안-머신러닝-모델テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol