逆強化学習・模倣学習の基礎と応用

オンライン開催

開催日

2023年4月20日(木) 10時00分～ 16時00分

修得知識

逆強化学習の問題設定
マルコフ決定過程・ベルマン方程式
例題を通じて逆強化学習の実装方法
制御分野と機械学習の共通部分
逆強化学習の事例
逆強化学習の応用範囲

プログラム

逆強化学習の位置づけ・機械学習の基礎
1. 逆強化学習と機械学習・最適制御の関係
  - 強化学習は制御と関連が強い
  - 逆強化学習と強化学習 (最適制御) と何が違う?
2. 機械学習の基礎のおさらい
  - 生成的 / 識別的
  - 経験リスク最小化
  - 様々な損失
  - 2クラス分類 / 他クラス分類 / 系列ラベル分類
    - … 構造的なデータに対しても「識別」は定義できる ⇒ 逆強化学習ではどうやって解く?
逆強化学習の定式化・解法
1. 強化学習の基礎:マルコフ決定過程、ベルマン方程式
  - 動的システム
  - マルコフ性
  - マルコフ決定過程 / 報酬関数
  - 価値関数 / ベルマン方程式
2. 逆強化学習の定式化とアルゴリズム
  - 報酬期待値の最大化
  - 損失関数の設定
  - 最大エントロピー逆強化学習
  - 周辺分布の獲得前向き・後ろ向き計算
3. 逆強化学習を適用しようとすると起きる問題は??
逆強化学習の適用例・最近の事例
1. 海外での適用事例、下坂研究室での事例
  - (簡易版) 車線変更
  - 経路選択
  - Zone 30マルコフの加減速モデリング
2. 連続・高次元化に向けた方向性、深層学習との融合
  - 関数近似の利用、離散化の工夫
  - 連続空間上のIRL:分配関数 (積分計算) の近似がポイント
  - この分野も深層NN、さらにはGANの導入が始まってきている

ページのトップヘ

講師

下坂正倫氏
東京工業大学情報理工学院情報工学系

准教授

ページのトップヘ

主催

株式会社トリケップス

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。

(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様

: 47,000円 (税別) / 51,700円 (税込)

1口

: 57,000円 (税別) / 62,700円 (税込) (3名まで受講可)

ライブ配信セミナーについて

本セミナーは「Zoom」を使ったライブ配信セミナーとなります。
お申し込み前に、視聴環境とテストミーティングへの参加手順をご確認いただき、テストミーティングにて動作確認をお願いいたします。
開催日前に、接続先URL、ミーティングID、パスワードを別途ご連絡いたします。
セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。

本セミナーは終了いたしました。

セミナーの再開催を依頼する

ページのトップヘ

ページ内で移動

これから開催される関連セミナー

開始日時		開催方法
2025/4/8	機械学習を用いたスペクトルデータ解析と材料開発への適用	オンライン
2025/4/9	マテリアルズインフォマティクス (MI) の最新動向と小規模データ駆動型MIの展開	オンライン
2025/4/10	Vision Transformerの仕組みとBEV Perception	オンライン
2025/4/11	マテリアルズインフォマティクスの基礎と高分子材料設計における応用事例	オンライン
2025/4/15	自動運転・運転支援に向けた各種センサーを用いた周辺環境認識技術	オンライン
2025/4/16	異常検知・学習データ作成のための生成AI活用	オンライン
2025/4/16	Pythonによる機械学習の基礎と実践	オンライン
2025/4/16	機械学習を用いたスペクトルデータ解析と材料開発への適用	オンライン
2025/4/17	スパース推定の基礎、本質の把握・理解と実装応用技術への展開	オンライン
2025/4/22	マテリアルズインフォマティクスの高分子材料開発への応用	オンライン
2025/4/22	未知の異常も検知する人工知能MTシステム (MT法) 基礎と応用入門	オンライン
2025/4/23	ベイズ推定を用いたデータ解析	オンライン
2025/4/25	機械学習のための効率的なデータ取得法と解釈・評価方法	オンライン
2025/4/25	マテリアルズインフォマティクスの基礎と高分子材料設計における応用事例	オンライン
2025/4/28	AI外観検査 (画像認識) のはじめ方、すすめ方、精度向上への考え方	オンライン
2025/4/30	未知の異常も検知する人工知能MTシステム (MT法) 基礎と応用入門	オンライン
2025/5/6	ベイズ推定を用いたデータ解析	オンライン
2025/5/7	生成AIを活用したデータ分析の基礎とポイント	オンライン
2025/5/7	機械学習のための効率的なデータ取得法と解釈・評価方法	オンライン
2025/5/13	異常検知への生成AI活用と判断の標準化、高精度化	オンライン

開始日時

会場

開催方法

2025/4/8

機械学習を用いたスペクトルデータ解析と材料開発への適用

オンライン

2025/4/9

マテリアルズインフォマティクス (MI) の最新動向と小規模データ駆動型MIの展開

オンライン

2025/4/10

Vision Transformerの仕組みとBEV Perception

オンライン

2025/4/11

マテリアルズインフォマティクスの基礎と高分子材料設計における応用事例

オンライン

2025/4/15

自動運転・運転支援に向けた各種センサーを用いた周辺環境認識技術

オンライン

2025/4/16

異常検知・学習データ作成のための生成AI活用

オンライン

2025/4/16

Pythonによる機械学習の基礎と実践

オンライン

2025/4/16

機械学習を用いたスペクトルデータ解析と材料開発への適用

オンライン

2025/4/17

スパース推定の基礎、本質の把握・理解と実装応用技術への展開

オンライン

2025/4/22

マテリアルズインフォマティクスの高分子材料開発への応用

オンライン

2025/4/22

未知の異常も検知する人工知能MTシステム (MT法) 基礎と応用入門

オンライン

2025/4/23

ベイズ推定を用いたデータ解析

オンライン

2025/4/25

機械学習のための効率的なデータ取得法と解釈・評価方法

オンライン

2025/4/25

マテリアルズインフォマティクスの基礎と高分子材料設計における応用事例

オンライン

2025/4/28

AI外観検査 (画像認識) のはじめ方、すすめ方、精度向上への考え方

オンライン

2025/4/30

未知の異常も検知する人工知能MTシステム (MT法) 基礎と応用入門

オンライン

2025/5/6

ベイズ推定を用いたデータ解析

オンライン

2025/5/7

生成AIを活用したデータ分析の基礎とポイント

オンライン

2025/5/7

機械学習のための効率的なデータ取得法と解釈・評価方法

オンライン

2025/5/13

異常検知への生成AI活用と判断の標準化、高精度化

オンライン

発行年月
2023/6/30	生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31	機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25	AIプロセッサー (CD-ROM版)
2021/10/25	AIプロセッサー
2021/7/30	マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/7/14	AIビジネスのブレークスルーと規制強化
2021/6/30	人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28	AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11	化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31	生体情報センシングと人の状態推定への応用
2020/4/30	生体情報計測による感情の可視化技術
2020/3/26	ビッグデータ・AIの利活用に伴う法的留意点
2020/3/24	リアルワールドデータの使用目的に応じた解析手法 - 各データベースの選択と組み合わせ -
2019/1/31	センサフュージョン技術の開発と応用事例
2018/5/31	“人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2013/6/21	機械学習によるパターン識別と画像認識への応用
1993/3/1	新しいサーボ制御の基礎と実用化技術

tech-seminar.jp

セミナー

セミナー (分野別)

出版物

お申し込み・ご購入

お問い合わせ

逆強化学習・模倣学習の基礎と応用

逆強化学習・模倣学習の基礎と応用

開催日

修得知識

プログラム

講師

主催

お問い合わせ

受講料

ライブ配信セミナーについて

ページ内で移動

これから開催される関連セミナー

関連する出版物