機械学習4日目


🤖 学習を強化する.

  • 強化学習(強化学習)
  • 先試
  • 経験による実力育成
  • 行動の結果が有利であれば奨励金がもらえる
  • 行動の結果不利であれば罰せられる
  • 以上の過程を何度も繰り返すと、より良い答えを見つけてより多くの奨励金を得ることができる
  • より多くの補償を受けられる政策を策定
  • 経験を通してますます賢くなってきたマシン
  • アルファ高、自主走行車
  • ゲーム実力者になる過程
  • ゲームは現在の状態をプレイヤーに見せる
  • キャラクターの位置と障害物の位置、現在の点数
  • 点数アップは賞
  • 障害物に遭遇して命を落とした罰
  • 観察の結果、どのような状態でどのように行動すればより多くの賞とより少ない罰を受けることができるかが分かった
  • 判断力の強化
  • 判断により以下の行動をとる
  • 行動がゲームを変える
  • ゲームと機械学習
  • ゲーム>>環境
  • プレイヤー>>エージェント
  • ゲーム画面>>ステータス
  • プレイヤーの操作>>行動
  • 賞罰>>奨励
  • プレイヤーの判断力>>ポリシー
  • 自己修練でより良い選択をするスキルが必要な場合は強化学習を選択
  • 勉強ができることを強化する
  • もっと強化学習事例を知りたいなら?
  • もしあなたが良い強化学習例を知っていたら?
  • 🤖 私に必要な機械の勉強は?

  • 機械学習指導
  • レモンサイダーカフェケース(回帰)
  • 過去のデータを持っている
  • 保有データが多い
  • 未知の従属変数がある
  • 未知の依存変数はカテゴリー型データ
  • 未知の依存変数は量子化データ
  • アルファ高校(強化学習)
  • 過去のデータを持っている
  • 報奨金を返す環境がある
  • カート分析(学習関連ルール)
  • 過去のデータを持っている
  • 保有データが多い
  • 未知の従属変数がある
  • 似たような観測値を組み合わせたい
  • 特性間の関係を見つけたい
  • 🍊 Orange3


    ほうこう

  • Orange3
  • ドラッグアンドドロップで
  • 表解析、可視化、機械学習が可能
  • 統計・データマイニング・データ科学分野用
  • 表を扱うツール
  • シナリオとポリシー

  • Orangeでできること
  • データシートに詳しい
  • 検索に必要な行
  • 不要な列を隠す
  • 計算カラムの値>>新規行の動的作成
  • 表の可視化
  • 座標平面
  • 図表
  • 機械学習
  • 現在の決定について
  • 未来予測
  • 設定

  • Orange 3ダウンロードページ接続
  • Download Orangeクリック
  • エラーを防止するには、インストールパスにハングルがないこと
  • ユーザーアカウントがハングルの場合、CドライブにOrangeフォルダを作成してパスにインストールする
  • 運転Orange 3
  • 출처: 생활코딩 - 머신러닝 야학