逆強化学習による報酬関数推定

入門

逆強化学習による報酬関数推定

東京都開催会場開催

開催日

2019年3月29日(金) 10時30分～ 16時30分

修得知識

逆強化学習の基本的な原理
代表的な逆強化学習手法の概要
報酬関数推定を介した強化学習の有用性と課題

プログラム

　強化学習は、a) システムに対する要求が明確である一方、b) それを満足するシステムの挙動の設計が困難な問題に対して有効なアプローチの1つです。ここで、a) のシステムに対する要求は、学習者の意思決定に対する評価である報酬関数によって表現されます。しかし、報酬関数は学習の安定性や効率などにも影響を与えるため、その設計は煩雑になりがちです。また、そもそもシステムに対する要求を報酬関数として書き下すことが困難な問題も存在します。
　このような背景から、手動で報酬関数を設計する代わりに他者の振る舞いを観測し、その振る舞いを説明する報酬関数を推定する、逆強化学習と呼ばれるアプローチが考案されました。
　本セミナーでは、強化学習の原理と特徴を俯瞰した上で、逆強化学習の基本的な考え方を解説します。また、代表的な逆強化学習手法及び関連する研究事例についても紹介します。受講者がご自身で逆強化学習を実装し、試していただくためのサポートとなるよう、基礎的な内容に重きを置いたセミナーを目指します。

はじめに
強化学習
1. 概要
2. 問題設定
3. ベルマン方程式
4. 離散系における強化学習
5. 連続系における強化学習
逆強化学習
1. 概要
2. 強化学習と逆強化学習
3. 問題設定
4. 基本的な考え方
5. 線形モデル
6. 非線形モデル
研究事例の紹介
まとめ

ページのトップヘ

講師

増山岳人氏
名城大学理工学部電気電子工学科

准教授

ページのトップヘ

会場

株式会社オーム社オームセミナー室

東京都千代田区神田錦町3-1

ページのトップヘ

主催

株式会社トリケップス

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。

(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様

: 46,000円 (税別) / 49,680円 (税込)

1口

: 57,000円 (税別) / 61,560円 (税込) (3名まで受講可)

本セミナーは終了いたしました。

セミナーの再開催を依頼する

ページのトップヘ

ページ内で移動

これから開催される関連セミナー

開始日時		開催方法
2025/7/15	開発の質と効率を向上する汎用的インフォマティクス & 統計的最適化実践入門	オンライン
2025/7/16	開発の質と効率を向上する汎用的インフォマティクス & 統計的最適化実践入門	オンライン
2025/7/22	第一原理計算と機械学習を活用した材料設計と応用展開	オンライン
2025/7/23	AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点	オンライン
2025/7/23	第一原理計算と機械学習を活用した材料設計と応用展開	オンライン
2025/7/24	外観検査のデジタル化・自動化	オンライン
2025/7/24	AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点	オンライン
2025/7/24	レーザー加工分野における機械学習の活用手法 : 特に少ない実験データ数を用いた場合	オンライン
2025/7/25	レーザー加工分野における機械学習の活用手法 : 特に少ない実験データ数を用いた場合	オンライン
2025/7/28	外観検査のデジタル化・自動化	オンライン
2025/7/30	Pythonを利用したデータ分析の基礎講座	オンライン
2025/7/30	ケモインフォマティクスと機械学習による化学データ解析	オンライン
2025/7/31	センサから取得した時系列データの処理・解析技術と機械学習の適用	オンライン
2025/7/31	スモールデータ解析の方法と実問題解決への応用	オンライン
2025/7/31	Pythonを利用したデータ分析の基礎講座	オンライン
2025/7/31	ケモインフォマティクスと機械学習による化学データ解析	オンライン
2025/8/1	スモールデータ解析の方法と実問題解決への応用	オンライン
2025/8/4	マテリアルズ・インフォマティクスへのデータ分析とその進め方	オンライン
2025/8/8	機械学習による適応的実験計画	オンライン
2025/8/8	ケモインフォマティクスにおけるデータ収集の最適化と解析手法	オンライン

開始日時

会場

開催方法

2025/7/15

開発の質と効率を向上する汎用的インフォマティクス & 統計的最適化実践入門

オンライン

2025/7/16

開発の質と効率を向上する汎用的インフォマティクス & 統計的最適化実践入門

オンライン

2025/7/22

第一原理計算と機械学習を活用した材料設計と応用展開

オンライン

2025/7/23

AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点

オンライン

2025/7/23

第一原理計算と機械学習を活用した材料設計と応用展開

オンライン

2025/7/24

外観検査のデジタル化・自動化

オンライン

2025/7/24

AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点

オンライン

2025/7/24

レーザー加工分野における機械学習の活用手法 : 特に少ない実験データ数を用いた場合

オンライン

2025/7/25

レーザー加工分野における機械学習の活用手法 : 特に少ない実験データ数を用いた場合

オンライン

2025/7/28

外観検査のデジタル化・自動化

オンライン

2025/7/30

Pythonを利用したデータ分析の基礎講座

オンライン

2025/7/30

ケモインフォマティクスと機械学習による化学データ解析

オンライン

2025/7/31

センサから取得した時系列データの処理・解析技術と機械学習の適用

オンライン

2025/7/31

スモールデータ解析の方法と実問題解決への応用

オンライン

2025/7/31

Pythonを利用したデータ分析の基礎講座

オンライン

2025/7/31

ケモインフォマティクスと機械学習による化学データ解析

オンライン

2025/8/1

スモールデータ解析の方法と実問題解決への応用

オンライン

2025/8/4

マテリアルズ・インフォマティクスへのデータ分析とその進め方

オンライン

2025/8/8

機械学習による適応的実験計画

オンライン

2025/8/8

ケモインフォマティクスにおけるデータ収集の最適化と解析手法

オンライン

発行年月
2024/10/31	少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発
2023/6/30	生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31	機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25	AIプロセッサー (CD-ROM版)
2021/10/25	AIプロセッサー
2021/7/30	マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/7/14	AIビジネスのブレークスルーと規制強化
2021/6/30	人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28	AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11	化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31	生体情報センシングと人の状態推定への応用
2020/4/30	生体情報計測による感情の可視化技術
2020/3/26	ビッグデータ・AIの利活用に伴う法的留意点
2020/3/24	リアルワールドデータの使用目的に応じた解析手法 - 各データベースの選択と組み合わせ -
2019/1/31	センサフュージョン技術の開発と応用事例
2018/5/31	“人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2013/6/21	機械学習によるパターン識別と画像認識への応用
1993/3/1	新しいサーボ制御の基礎と実用化技術

tech-seminar.jp

セミナー

セミナー (分野別)

出版物

お申し込み・ご購入

お問い合わせ