Today Iは5週間の機械学習の基礎Day 2+aを学びました

3144 ワード

決定理論とは!


新しい値xが与えられた場合,確率モデルp(x,t)に基づいて最適な決定を下す.


推論段階:結合確率分布p(x,ck)p(x,c k)p(x,ck)-p(cx
  • 決定フェーズ:与えられた状況確率の場合、最適な決定をどのように行うかを決定するフェーズ
  • きたいそんしつさいしょう


    すべての決定に同じリスクがあるわけではない。


    ex)

  • は癌ではないが、癌と診断された
  • は癌であるが非癌と診断された
  • E[L]式整理



    所望の損失を減らす医療診断例

  • は癌ではないが、癌と診断された1
  • 癌で非癌と診断された100


  • けっていりろんかいき


  • 損失関数L(x,y(x)=(y(x)−t)2 L(x,y(x)={(y(x)−t)}^2 L(x,y(x)=(y(x)−t)2


  • xに対する最適予測値y(x)y(x)y(x)は、Et[t∣x]Et[t|x]Et[t∣x]である.
  • Euler - Lagrange Equation



  • Euler-Lagrange方程式による
    最小のy(x)を求めることができます.

  • このときdG∮/dxdy’dG*/dxdy‘dG∮/dxdy’は0となり計算が容易である


  • 上記式に示すように、y(x)y(x)y(x)については、Et[t∣x]Et[t∣x]であることがわかる.
  • EDAチャレンジにおけるコードテクニック


    「100%」という文字列形式の割合をfloat形式に変換する

    def ptf(p):
        return float(p.strip('%'))/100 #'35%' -> 0.35
        

    infoでデータ型を確認する



    Null値をチェックするには

  • dataframe.isnull().sum()
  • 列ごとのデータ型の置換

  • data[欲しい列]です.astype(「私の好きなタイプ」ex)bool、float 64、int 64)
  • データにはnull値があり、変更したい場合はnull値があります。

  • データ[Null値を持つカラム]=データ[Null値を持つカラム]です.replace(np.nan,「貸したいもの」)
  • テストエンコーディングの準備中に認識した

    print('새로 알게된것', end= " ")
    print("end를 쓰면 두줄이 한줄로 나와요")
    # 새로 알게된것 end를 쓰면 두줄이 한줄로 나와요