技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

逆強化学習の基礎、手法選択と応用

逆強化学習の基礎、手法選択と応用

東京都 開催 会場 開催

開催日

  • 2020年1月20日(月) 10時00分 17時00分

プログラム

  1. 第1部 逆強化学習の基礎知識
    1. マルコフ決定過程
      1. 平均とマルコフ性 (MP)
      2. 逐次平均表現とMP
      3. マルコフ報酬過程
      4. マルコフ決定過程
    2. Bellman方程式の導出
      1. 平均から決定型Bellman方程式の導入
      2. 平均表現と価値関数の導入
      3. 確率型Bellman方程式の導出
        1. 行動状態価値関数の導入
        2. 確率型ベルマン方程式の導出
        3. 遷移確率関数 T (r ( S’) , S‘│s,a ) の極意
        4. グリッドワード問題の応用
    3. 動的計画法
      1. ε = 1-Greedy反復方策
      2. ε = 0-Greedy方策反復法 (On-Policy)
      3. ε = 0-Greedy価値反復法 (Off-Policy)
    4. 逆強化学習の基本概念の導入
      1. 報酬関数の定義
      2. 報酬関数による価値関数の推定
  2. 第2部 逆強化学習の解法:線形計画最適化逆強化学習手法
    1. 線形計画最適化逆強化学習手法の導入
    2. 線形計画逆強化学習手法の定式化
    3. 線形計画逆強化学習手法のコーディング要領
    4. 線形計画逆強化学習手法の応用事例の紹介
  3. 第3部 逆強化学習の解法:最大エントロピー逆強化学習手法
    1. 関数近似の基本概念
    2. 関数近似モデルを用いた報酬の表現
    3. 機械学習による報酬関数の回帰
    4. 最大エントロピーを取り入れた報酬誤差関数の設計
    5. 熟練者による行動確率教師データの生成
    6. 最大エントロピー逆強化学習手法のコーディング要領
    7. 最大エントロピー逆強化学習手法の応用事例の紹介
  4. 第4部 逆強化学習の解法:深層NN最大エントロピー逆強化学習手法
    1. 深層NN (neural network) の導入
    2. 深層NN最大エントロピーを取り入れた報酬誤差関数の設計
    3. 熟練者による状態頻度教師データの生成
    4. 深層NN最大エントロピー逆強化学習手法のコーディング要領
    5. 深層NN最大エントロピー逆強化学習手法の応用事例の紹介
  5. 第5部 逆強化学習の展望と関連技術の紹介
    • 質疑応答

講師

  • 曽我部 東馬
    電気通信大学 i-パワードエネルギーシステム研究センター 基盤理工学専攻
    准教授

会場

株式会社 技術情報協会
東京都 品川区 西五反田2-29-5 日幸五反田ビル8F
株式会社 技術情報協会の地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 50,000円 (税別) / 55,000円 (税込)
複数名
: 45,000円 (税別) / 49,500円 (税込)

複数名同時受講割引について

  • 2名様以上でお申込みの場合、
    1名あたり 45,000円(税別) / 49,500円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 50,000円(税別) / 55,000円(税込)
    • 2名様でお申し込みの場合 : 2名で 90,000円(税別) / 99,000円(税込)
    • 3名様でお申し込みの場合 : 3名で 135,000円(税別) / 148,500円(税込)
  • 同一法人内による複数名同時申込みのみ適用いたします。
  • 受講券、請求書は、代表者にご郵送いたします。
  • 他の割引は併用できません。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2025/2/27 医薬品CMC・製造におけるAI・機械学習・データ活用の課題と導入のポイント オンライン
2025/3/4 マテリアルズインフォマティクスの動向と小規模・実験データへの応用 オンライン
2025/3/5 Pythonプログラムにおける高速化と大容量データの扱い オンライン
2025/3/7 エッジAIの実現に向けた課題、展望と産業応用事例 オンライン
2025/3/7 スペクトル・イメージデータへの機械学習の応用 オンライン
2025/3/11 Pythonプログラムにおける高速化と大容量データの扱い オンライン
2025/3/12 次世代太陽電池 (有機薄膜、ペロブスカイト) の基礎・課題・技術動向 オンライン
2025/3/17 時系列データ分析の基礎と実務への応用 オンライン
2025/3/19 Pythonを用いたケモインフォマティクス入門 オンライン
2025/3/19 ベイズ統計を利用した機械学習:基礎と実践 オンライン
2025/3/24 予測AI/生成AIを製造現場で活用するためのデータ収集、蓄積と構造化のポイント オンライン
2025/3/26 ベイズ推定の基礎およびPythonを用いたデータ解析 オンライン
2025/3/26 マテリアルズインフォマティクス (MI) の最新動向と小規模データ駆動型MIの展開 オンライン
2025/3/28 少数データ、データ不足における機械学習適用の問題解決方法とその戦略 オンライン
2025/4/2 ベイズ推定の基礎およびPythonを用いたデータ解析 オンライン
2025/4/4 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン
2025/4/8 機械学習を用いたスペクトルデータ解析と材料開発への適用 オンライン
2025/4/9 マテリアルズインフォマティクス (MI) の最新動向と小規模データ駆動型MIの展開 オンライン
2025/4/10 Vision Transformerの仕組みとBEV Perception オンライン
2025/4/11 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン