技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

強化学習の基礎から最新動向と機械制御への応用

強化学習の基礎から最新動向と機械制御への応用

~強化学習法の基礎、応用に向けた報酬の設計指針や対処法について解説~
オンライン 開催

概要

本セミナーでは、強化学習について基礎から解説し、ロボットなどの機械制御への応用が特に期待される最新の強化学習アルゴリズムや、応用の際に悩みの種となりやすい報酬の設計指針や対処法について実際の応用事例と合わせて紹介いたします。

配信期間

  • 2026年1月16日(金) 12時30分2026年1月30日(金) 16時30分

お申し込みの締切日

  • 2026年1月28日(水) 16時30分

修得知識

  • 強化学習の基本的な仕組み
  • 強化学習の応用に向けた注意点、課題と対策

プログラム

 深層学習の登場によって一躍注目度を高めたAIは、そのほとんどが用意された膨大なデータセットからデータ間に潜む関係性を見出すことを目的としています。これに対して、最近はAIが見出した関係性を基に新たなデータを生成する生成AIへと発展してきました。中でも、その生成を通じて実世界に物理的に作用するフィジカルAIやEmbodied Inteligenceと呼ばれる概念が次世代AIとして大きな注目を集めています。
 本セミナーでは、そのようなAI技術の一つである強化学習について紹介します。強化学習では、ロボットやゲームAIなどのエージェントが自ら試行錯誤して得た経験データに基づいて学習して、目的を達成できる行動のルール (方策) を獲得することを目指しますが、一般的なAIと比べて学習の仕組みや使い方が分かりづらいと良く指摘されています。なので、本セミナーでは強化学習の基礎から近年の定番化したアルゴリズムまで簡潔に要点を説明するとともに、その応用時の注意点なども実例を通じて紹介します。

  1. 強化学習とは
    1. 強化学習の目的
    2. マルコフ決定過程
    3. 学習すべき要素
  2. 学習アルゴリズムの基礎
    1. 価値関数の学習
    2. 方策関数の学習
    3. 深層強化学習でのテクニック
  3. 最新のActor-Criticアルゴリズム
    1. 方策更新の制限:TRPO/PPO
    2. 方策エントロピーの最大化:SQL/SAC
  4. モデルベース強化学習
    1. 世界モデルの学習・活用法
    2. 既存モデルの活用法・Sim-to-Real
  5. 報酬設計の課題と対策
    1. 疎な報酬
    2. 安全性の担保

講師

  • 小林 泰介
    国立情報学研究所 情報学プリンシプル研究系
    助教

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 45,000円 (税別) / 49,500円 (税込)
複数名
: 22,500円 (税別) / 24,750円 (税込) (案内をご希望の場合に限ります)

案内割引・複数名同時申込割引について

R&D支援センターからの案内登録をご希望の方は、割引特典を受けられます。
案内および割引をご希望される方は、お申込みの際、「案内の希望 (割引適用)」の欄から案内方法をご選択ください。

「案内の希望」をご選択いただいた場合、1名様 42,000円(税別) / 46,200円(税込) で受講いただけます。
複数名で同時に申込いただいた場合、1名様につき 22,500円(税別) / 24,750円(税込) で受講いただけます。

  • R&D支援センターからの案内を希望する方
    • 1名様でお申し込みの場合 : 1名で 42,000円(税別) / 46,200円(税込)
    • 2名様でお申し込みの場合 : 2名で 45,000円(税別) / 49,500円(税込)
    • 3名様でお申し込みの場合 : 3名で 67,500円(税別) / 74,250円(税込)
  • R&D支援センターからの案内を希望しない方
    • 1名様でお申し込みの場合 : 1名で 45,000円(税別) / 49,500円(税込)
    • 2名様でお申し込みの場合 : 2名で 90,000円(税別) / 99,000円(税込)
    • 3名様でお申し込みの場合 : 3名で 135,000円(税別) / 148,500円(税込)

アーカイブ配信セミナー

  • 当日のセミナーを、後日にお手元のPCやスマホ・タブレッドなどからご視聴・学習することができます。
  • 配信開始となりましたら、改めてメールでご案内いたします。
  • 視聴サイトにログインしていただき、ご視聴いただきます。
  • 視聴期間は2026年1月16日〜30日を予定しております。
    ご視聴いただけなかった場合でも期間延長いたしませんのでご注意ください。

これから開催される関連セミナー

開始日時 会場 開催方法
2026/1/15 プラスチック成形、樹脂/フィラー分散、フィルム製膜におけるAI、データサイエンスの活用、DX化/IoTへの展望 オンライン
2026/1/15 逆問題解析による材料の構造、プロセス条件設計 オンライン
2026/1/15 強化学習の基礎から最新動向と機械制御への応用 オンライン
2026/1/19 Excel/Pythonを活用した製造現場の品質データ分析入門 オンライン
2026/1/19 マテリアルズ・インフォマティクスの実践と低誘電材料開発への応用 オンライン
2026/1/19 EMCの基礎と機械学習・深層学習の応用技術 オンライン
2026/1/20 EMCの基礎と機械学習・深層学習の応用技術 オンライン
2026/1/21 制御のためのシステム同定 (基礎編) オンライン
2026/1/26 機械学習と脳科学におけるベイズ統計 オンライン
2026/1/26 外観検査 (2日間) オンライン
2026/1/26 AI外観検査 (画像認識) のはじめ方、すすめ方、精度の向上 オンライン
2026/1/27 AIの選択・精度・効率・構造・コストなどの最適化原理 オンライン
2026/1/27 時系列データ分析 入門 : 基礎とExcelでの実行方法 オンライン
2026/1/28 ディジタルフィルタを理解する オンライン
2026/1/28 Excel/Pythonを活用した製造現場の品質データ分析入門 オンライン
2026/1/28 データ分析およびAIエージェントの基礎と活用に向けたポイント オンライン
2026/1/30 AI・IoT時代の生産現場を支えるデジタル信号処理の基礎と実践応用テクニック オンライン
2026/2/2 AI・IoT時代の生産現場を支えるデジタル信号処理の基礎と実践応用テクニック オンライン
2026/2/4 AI外観検査の導入プロセスと実践ノウハウ オンライン
2026/2/5 AI外観検査の導入プロセスと実践ノウハウ オンライン

関連する出版物

発行年月
2025/6/9 無人搬送システム〔2025年版〕 技術開発実態分析調査報告書 (CD-ROM版)
2025/6/9 無人搬送システム〔2025年版〕 技術開発実態分析調査報告書 (書籍版)
2024/10/31 少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発
2023/6/30 生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31 機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25 AIプロセッサー (CD-ROM版)
2021/10/25 AIプロセッサー
2021/7/30 マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/6/30 人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28 AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11 化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31 生体情報センシングと人の状態推定への応用
2020/4/30 生体情報計測による感情の可視化技術
2019/1/31 センサフュージョン技術の開発と応用事例
2018/5/31 “人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2018/5/31 最先端医療機器の病院への普及展望と今後の製品開発
2017/7/27 ウェアラブル機器の開発とマーケット・アプリケーション・法規制動向
2015/6/26 2015年版 民生機器用蓄電池市場の実態と将来展望
2014/9/25 サービスロボット 技術開発実態分析調査報告書
2014/9/25 サービスロボット 技術開発実態分析調査報告書 (CD-ROM版)