逆強化学習・模倣学習の基礎と応用

東京都開催会場開催

開催日

2019年11月27日(水) 10時30分～ 16時30分

修得知識

逆強化学習の問題設定
マルコフ決定過程・ベルマン方程式
例題を通じて逆強化学習の実装方法
制御分野と機械学習の共通部分
逆強化学習の事例
逆強化学習の応用範囲

プログラム

　逆強化学習は統計を基盤とした機械学習と最適制御の学際領域を担う、近年発達著しい研究領域である。強化学習が「成功」と「失敗」の繰り返しの経験から、ロボットに最適な動作を自律獲得させる学習の仕組みであるのに対し、逆強化学習は、明文化が難しい熟練者の巧みなスキルを機械に自律獲得させる、見まねを通じた学習の枠組みになっている。
　熟練者のうまみ=「報酬」を、観察に基づき推定する枠組みとみなせるため、逆強化学習は、強化学習の逆問題に相当するものである。そのため逆強化学習は模倣学習と呼ばれるほか、逆最適制御とも呼ばれる。
　本セミナーでは、逆強化学習の基盤となる数理的な問題設定の基本を説明するとともに、講師の研究室での経験を踏まえ、初学者が陥りがちな課題を整理し、逆強化学習アルゴリズムの実装方法やどのように適用するかに焦点をあて、説明を進めていく。その次に逆強化学習の応用事例を幅広く紹介する予定である。特に強化学習の実応用で問題となる報酬関数の設計など、明文化が難しいスキルの「コツ」といったものをモデル化することに適した技術であり、人行動のモデル化を中心とした話題を提供したいと考えている。例えば状況に応じた運転経路・目的地予測、人と人とのインタラクション行動の予測、運転の好みに応じた追い越し運転予測といった応用などを紹介する予定である。最後に、逆強化学習が抱える課題を共有し、この分野の発展につながればと考えている。

機械学習・制御における逆強化学習の位置づけ
1. 機械学習における位置づけ
2. 最適制御との接点
3. 逆強化学習の応用分野・従来の時系列データ解析との違い
機械学習の基礎 (概要)
1. 識別的な機械学習の一般的な定式化
2. 正則化付き経験損失最小化
3. 典型的な識別問題 (分類・回帰) の例
4. 逆強化学習における問題設定
時系列データのモデリング : マルコフ決定過程と最適制御
1. 時系列データモデリング
  1. マルコフ過程・動的システム
2. 報酬と紐付く時系列データモデリング
  1. マルコフ決定過程
3. 報酬関数最大化問題 : 最適制御・最適政策
4. ベルマン方程式・価値反復法
逆強化学習
1. 逆強化学習の定式化
2. 逆強化学習の損失関数の設計
3. 逆強化学習のパラメータ最適化
逆強化学習の適用
1. 逆強化学習の実装
2. 研究事例から学ぶ逆強化学習の適用事例
  1. マルコフ決定過程 (状態空間・行動) の設計の実例
  2. 報酬関数設計の実例
逆強化学習の最近の話題
- 逆強化学習の高速化
- 高次元化
- 文脈の活用
- マルチエージェント問題
- 深層学習との融合
- 落穂拾い
まとめ

ページのトップヘ

講師

下坂正倫氏
東京工業大学情報理工学院情報工学系

准教授

ページのトップヘ

会場

ちよだプラットフォームスクウェア

東京都千代田区神田錦町3-21

ページのトップヘ

主催

株式会社トリケップス

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。

(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様

: 46,000円 (税別) / 50,600円 (税込)

1口

: 57,000円 (税別) / 62,700円 (税込) (3名まで受講可)

本セミナーは終了いたしました。

セミナーの再開催を依頼する

ページのトップヘ

開始日時		開催方法
2026/2/5	AI外観検査の導入プロセスと実践ノウハウ	オンライン
2026/2/6	データ分析およびAIエージェントの基礎と活用に向けたポイント	オンライン
2026/2/13	AI外観検査 (画像認識) のはじめ方、すすめ方、精度の向上	オンライン
2026/3/13	開発・生産現場で諸課題を解決に導くデータ駆動型手法 / ディープニューラルネットワークモデル / MTシステムの基礎と応用	オンライン
2026/4/17	因子ごとの最適条件を少ない実験回数で見つける統計的手法「実験計画法」 & 汎用的インフォマティクス「非線形実験計画法」	オンライン

発行年月
2024/10/31	少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発
2023/6/30	生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31	機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25	AIプロセッサー
2021/10/25	AIプロセッサー (CD-ROM版)
2021/7/30	マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/6/30	人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28	AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11	化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31	生体情報センシングと人の状態推定への応用
2020/4/30	生体情報計測による感情の可視化技術
2019/1/31	センサフュージョン技術の開発と応用事例
2018/5/31	“人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2013/6/21	機械学習によるパターン識別と画像認識への応用
1993/3/1	新しいサーボ制御の基礎と実用化技術

tech-seminar.jp

セミナー

セミナー (分野別)

出版物

お申し込み・ご購入

お問い合わせ