逆強化学習

東京都開催会場開催デモ付き

開催日

2018年12月10日(月) 10時30分～ 16時30分

プログラム

第1部逆強化学習の基礎知識
1. マルコフ決定過程
  - 平均とマルコフ性 (MP)
  - 逐次平均表現とMP
  - マルコフ報酬過程
  - マルコフ決定過程
2. Bellman方程式の導出:
  - 平均から決定型Bellman方程式の導入:
  - 平均表現と価値関数の導入:
  - 確率型Bellman方程式の導出:
    1. 行動状態価値関数の導入:
    2. 確率型ベルマン方程式の導出
    3. 遷移確率関数 T (r ( S’) , S‘│s,a ) の極意
    4. グリッドワード問題の応用
3. 動的計画法
  - ε = 1-Greedy反復方策
  - ε = 0-Greedy方策反復法 (On-Policy)
  - ε = 0-Greedy価値反復法 (Off-Policy)
4. 逆強化学習の基本概念の導入
  - 報酬関数の定義
  - 報酬関数による価値関数の推定
第2部逆強化学習の解法:線形計画最適化逆強化学習手法
1. 線形計画最適化逆強化学習手法の導入
2. 線形計画逆強化学習手法の定式化
3. 線形計画逆強化学習手法のコーディング要領
4. 線形計画逆強化学習手法の応用事例の紹介
第3部逆強化学習の解法:最大エントロピー逆強化学習手法
1. 関数近似の基本概念
2. 関数近似モデルを用いた報酬の表現
3. 機械学習による報酬関数の回帰
4. 最大エントロピーを取り入れた報酬誤差関数の設計
5. 熟練者による行動確率教師データの生成
6. 最大エントロピー逆強化学習手法のコーディング要領
7. 最大エントロピー逆強化学習手法の応用事例の紹介
第4部逆強化学習の解法:深層NN最大エントロピー逆強化学習手法
1. 深層NN (neural network) の導入
2. 深層NN最大エントロピーを取り入れた報酬誤差関数の設計
3. 熟練者による状態頻度教師データの生成
4. 深層NN最大エントロピー逆強化学習手法のコーディング要領
5. 深層NN最大エントロピー逆強化学習手法の応用事例の紹介
第5部逆強化学習の展望と関連技術の紹介

ページのトップヘ

講師

曽我部東馬氏
電気通信大学 i-パワードエネルギーシステム研究センター基盤理工学専攻

教授

ページのトップヘ

会場

株式会社オーム社オームセミナー室

東京都千代田区神田錦町3-1

ページのトップヘ

主催

株式会社トリケップス

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。

(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様

: 46,000円 (税別) / 49,680円 (税込)

1口

: 57,000円 (税別) / 61,560円 (税込) (3名まで受講可)

本セミナーは終了いたしました。

セミナーの再開催を依頼する

ページのトップヘ

ページ内で移動

これから開催される関連セミナー

開始日時		開催方法
2026/7/27	外観検査のデジタル化・自動化	オンライン
2026/7/28	Pythonを用いたスペクトルデータ解析 (前編・後編)	オンライン
2026/7/28	Pythonを用いたスペクトルデータ解析 (前編)	オンライン
2026/7/28	産業現場のAI機械学習による異常検知予知の実例集	オンライン
2026/7/28	AI/生成AIによる知財業務の効率化と導入・運用のポイント	オンライン
2026/7/29	ラボオートメーションに向けた実験環境の構築と導入・実装のポイント	オンライン
2026/7/29	Pythonを用いたスペクトルデータ解析 (後編)	オンライン
2026/7/29	知財業務における生成AI・AIエージェント活用とコーディングの進め方	オンライン
2026/7/30	Pythonを用いたスペクトルデータ解析 (前編・後編)	オンライン
2026/7/30	Pythonを用いたスペクトルデータ解析 (前編)	オンライン
2026/7/30	Pythonを用いたスペクトルデータ解析 (後編)	オンライン
2026/7/30	産業現場のAI機械学習による異常検知予知の実例集	オンライン
2026/7/31	製造現場における正常/異常判定の考え方とデータ解析結果の使いこなし方	オンライン
2026/7/31	生成AI×特許情報活用の実践	オンライン
2026/7/31	感性工学商品開発プロセスへのAI応用	オンライン
2026/8/3	生成AI×特許情報活用の実践	オンライン
2026/8/4	マテリアルズ・インフォマティクスのためのデータの生成・蓄積・活用方法	オンライン
2026/8/4	多成分混合物の物性予測と機械学習の活用	オンライン
2026/8/6	機械学習による適応的実験計画	オンライン
2026/8/7	臨床研究のためのサンプルサイズ設計入門	オンライン

開始日時

会場

開催方法

2026/7/27

外観検査のデジタル化・自動化

オンライン

2026/7/28

Pythonを用いたスペクトルデータ解析 (前編・後編)

オンライン

2026/7/28

Pythonを用いたスペクトルデータ解析 (前編)

オンライン

2026/7/28

産業現場のAI機械学習による異常検知予知の実例集

オンライン

2026/7/28

AI/生成AIによる知財業務の効率化と導入・運用のポイント

オンライン

2026/7/29

ラボオートメーションに向けた実験環境の構築と導入・実装のポイント

オンライン

2026/7/29

Pythonを用いたスペクトルデータ解析 (後編)

オンライン

2026/7/29

知財業務における生成AI・AIエージェント活用とコーディングの進め方

オンライン

2026/7/30

Pythonを用いたスペクトルデータ解析 (前編・後編)

オンライン

2026/7/30

Pythonを用いたスペクトルデータ解析 (前編)

オンライン

2026/7/30

Pythonを用いたスペクトルデータ解析 (後編)

オンライン

2026/7/30

産業現場のAI機械学習による異常検知予知の実例集

オンライン

2026/7/31

製造現場における正常/異常判定の考え方とデータ解析結果の使いこなし方

オンライン

2026/7/31

生成AI×特許情報活用の実践

オンライン

2026/7/31

感性工学商品開発プロセスへのAI応用

オンライン

2026/8/3

生成AI×特許情報活用の実践

オンライン

2026/8/4

マテリアルズ・インフォマティクスのためのデータの生成・蓄積・活用方法

オンライン

2026/8/4

多成分混合物の物性予測と機械学習の活用

オンライン

2026/8/6

機械学習による適応的実験計画

オンライン

2026/8/7

臨床研究のためのサンプルサイズ設計入門

オンライン

発行年月
2024/10/31	少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発
2023/6/30	生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31	機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25	AIプロセッサー (CD-ROM版)
2021/10/25	AIプロセッサー
2021/7/30	マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/6/30	人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28	AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11	化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31	生体情報センシングと人の状態推定への応用
2020/4/30	生体情報計測による感情の可視化技術
2019/1/31	センサフュージョン技術の開発と応用事例
2018/5/31	“人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2013/6/21	機械学習によるパターン識別と画像認識への応用
1993/3/1	新しいサーボ制御の基礎と実用化技術

tech-seminar.jp

セミナー

セミナー (分野別)

出版物

お申し込み・ご購入

お問い合わせ

逆強化学習

逆強化学習

開催日

プログラム

講師

会場

主催

お問い合わせ

受講料

ページ内で移動

これから開催される関連セミナー

関連する出版物