技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー
技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー
逆強化学習は統計を基盤とした機械学習と最適制御の学際領域を担う、近年発達著しい研究領域である。強化学習が「成功」と「失敗」の繰り返しの経験から、ロボットに最適な動作を自律獲得させる学習の仕組みであるのに対し、逆強化学習は、明文化が難しい熟練者の巧みなスキルを機械に自律獲得させる、見まねを通じた学習の枠組みになっている。
熟練者のうまみ=「報酬」を、観察に基づき推定する枠組みとみなせるため、逆強化学習は、強化学習の逆問題に相当するものである。そのため逆強化学習は模倣学習と呼ばれるほか、逆最適制御とも呼ばれる。
本セミナーでは、逆強化学習の基盤となる数理的な問題設定の基本を説明するとともに、講師の研究室での経験を踏まえ、初学者が陥りがちな課題を整理し、逆強化学習アルゴリズムの実装方法やどのように適用するかに焦点をあて、説明を進めていく。その次に逆強化学習の応用事例を幅広く紹介する予定である。特に強化学習の実応用で問題となる報酬関数の設計など、明文化が難しいスキルの「コツ」といったものをモデル化することに適した技術であり、人行動のモデル化を中心とした話題を提供したいと考えている。例えば状況に応じた運転経路・目的地予測、人と人とのインタラクション行動の予測、運転の好みに応じた追い越し運転予測といった応用などを紹介する予定である。最後に、逆強化学習が抱える課題を共有し、この分野の発展につながればと考えている。
| 開始日時 | 会場 | 開催方法 | |
|---|---|---|---|
| 2026/2/5 | AI外観検査の導入プロセスと実践ノウハウ | オンライン | |
| 2026/2/6 | データ分析およびAIエージェントの基礎と活用に向けたポイント | オンライン | |
| 2026/2/13 | AI外観検査 (画像認識) のはじめ方、すすめ方、精度の向上 | オンライン | |
| 2026/3/13 | 開発・生産現場で諸課題を解決に導くデータ駆動型手法 / ディープニューラルネットワークモデル / MTシステムの基礎と応用 | オンライン | |
| 2026/4/17 | 因子ごとの最適条件を少ない実験回数で見つける統計的手法「実験計画法」 & 汎用的インフォマティクス「非線形実験計画法」 | オンライン |
| 発行年月 | |
|---|---|
| 2024/10/31 | 少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発 |
| 2023/6/30 | 生産プロセスにおけるIoT、ローカル5Gの活用 |
| 2022/12/31 | 機械学習・ディープラーニングによる "異常検知" 技術と活用事例集 |
| 2021/10/25 | AIプロセッサー |
| 2021/10/25 | AIプロセッサー (CD-ROM版) |
| 2021/7/30 | マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例 |
| 2021/6/30 | 人工知能を用いた五感・認知機能の可視化とメカニズム解明 |
| 2021/6/28 | AI・MI・計算科学を活用した蓄電池研究開発動向 |
| 2020/8/11 | 化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート |
| 2020/7/31 | 生体情報センシングと人の状態推定への応用 |
| 2020/4/30 | 生体情報計測による感情の可視化技術 |
| 2019/1/31 | センサフュージョン技術の開発と応用事例 |
| 2018/5/31 | “人工知能”の導入による生産性、効率性の向上、新製品開発への活用 |
| 2013/6/21 | 機械学習によるパターン識別と画像認識への応用 |
| 1993/3/1 | 新しいサーボ制御の基礎と実用化技術 |