技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

逆強化学習の基礎、手法選択と応用

逆強化学習の基礎、手法選択と応用

東京都 開催 会場 開催

開催日

  • 2020年1月20日(月) 10時00分17時00分

プログラム

  1. 第1部 逆強化学習の基礎知識
    1. マルコフ決定過程
      1. 平均とマルコフ性 (MP)
      2. 逐次平均表現とMP
      3. マルコフ報酬過程
      4. マルコフ決定過程
    2. Bellman方程式の導出
      1. 平均から決定型Bellman方程式の導入
      2. 平均表現と価値関数の導入
      3. 確率型Bellman方程式の導出
        1. 行動状態価値関数の導入
        2. 確率型ベルマン方程式の導出
        3. 遷移確率関数 T (r ( S’) , S‘│s,a ) の極意
        4. グリッドワード問題の応用
    3. 動的計画法
      1. ε = 1-Greedy反復方策
      2. ε = 0-Greedy方策反復法 (On-Policy)
      3. ε = 0-Greedy価値反復法 (Off-Policy)
    4. 逆強化学習の基本概念の導入
      1. 報酬関数の定義
      2. 報酬関数による価値関数の推定
  2. 第2部 逆強化学習の解法:線形計画最適化逆強化学習手法
    1. 線形計画最適化逆強化学習手法の導入
    2. 線形計画逆強化学習手法の定式化
    3. 線形計画逆強化学習手法のコーディング要領
    4. 線形計画逆強化学習手法の応用事例の紹介
  3. 第3部 逆強化学習の解法:最大エントロピー逆強化学習手法
    1. 関数近似の基本概念
    2. 関数近似モデルを用いた報酬の表現
    3. 機械学習による報酬関数の回帰
    4. 最大エントロピーを取り入れた報酬誤差関数の設計
    5. 熟練者による行動確率教師データの生成
    6. 最大エントロピー逆強化学習手法のコーディング要領
    7. 最大エントロピー逆強化学習手法の応用事例の紹介
  4. 第4部 逆強化学習の解法:深層NN最大エントロピー逆強化学習手法
    1. 深層NN (neural network) の導入
    2. 深層NN最大エントロピーを取り入れた報酬誤差関数の設計
    3. 熟練者による状態頻度教師データの生成
    4. 深層NN最大エントロピー逆強化学習手法のコーディング要領
    5. 深層NN最大エントロピー逆強化学習手法の応用事例の紹介
  5. 第5部 逆強化学習の展望と関連技術の紹介
    • 質疑応答

講師

  • 曽我部 東馬
    電気通信大学 i-パワードエネルギーシステム研究センター 基盤理工学専攻
    准教授

会場

株式会社 技術情報協会
東京都 品川区 西五反田2-29-5 日幸五反田ビル8F
株式会社 技術情報協会の地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 50,000円 (税別) / 55,000円 (税込)
複数名
: 45,000円 (税別) / 49,500円 (税込)

複数名同時受講割引について

  • 2名様以上でお申込みの場合、
    1名あたり 45,000円(税別) / 49,500円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 50,000円(税別) / 55,000円(税込)
    • 2名様でお申し込みの場合 : 2名で 90,000円(税別) / 99,000円(税込)
    • 3名様でお申し込みの場合 : 3名で 135,000円(税別) / 148,500円(税込)
  • 同一法人内による複数名同時申込みのみ適用いたします。
  • 受講券、請求書は、代表者にご郵送いたします。
  • 他の割引は併用できません。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2025/7/8 少ないデータによるAI・機械学習の進め方、活用の仕方 オンライン
2025/7/15 開発の質と効率を向上する汎用的インフォマティクス & 統計的最適化 実践入門 オンライン
2025/7/16 開発の質と効率を向上する汎用的インフォマティクス & 統計的最適化 実践入門 オンライン
2025/7/22 第一原理計算と機械学習を活用した材料設計と応用展開 オンライン
2025/7/23 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン
2025/7/23 第一原理計算と機械学習を活用した材料設計と応用展開 オンライン
2025/7/24 外観検査のデジタル化・自動化 オンライン
2025/7/24 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン
2025/7/24 レーザー加工分野における機械学習の活用手法 : 特に少ない実験データ数を用いた場合 オンライン
2025/7/25 レーザー加工分野における機械学習の活用手法 : 特に少ない実験データ数を用いた場合 オンライン
2025/7/28 外観検査のデジタル化・自動化 オンライン
2025/7/30 Pythonを利用したデータ分析の基礎講座 オンライン
2025/7/30 ケモインフォマティクスと機械学習による化学データ解析 オンライン
2025/7/31 センサから取得した時系列データの処理・解析技術と機械学習の適用 オンライン
2025/7/31 スモールデータ解析の方法と実問題解決への応用 オンライン
2025/7/31 Pythonを利用したデータ分析の基礎講座 オンライン
2025/7/31 ケモインフォマティクスと機械学習による化学データ解析 オンライン
2025/8/1 スモールデータ解析の方法と実問題解決への応用 オンライン
2025/8/4 マテリアルズ・インフォマティクスへのデータ分析とその進め方 オンライン
2025/8/8 機械学習による適応的実験計画 オンライン

関連する出版物