技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

強化学習の基礎・発展と機械・ロボット制御への応用

強化学習の基礎・発展と機械・ロボット制御への応用

~強化学習法の基礎、応用に向けた報酬の設計指針や対処法について解説~
オンライン 開催

概要

本セミナーでは、強化学習について基礎から解説し、ロボットなどの機械制御への応用が特に期待される最新の強化学習アルゴリズムや、応用の際に悩みの種となりやすい報酬の設計指針や対処法について実際の応用事例と合わせて紹介いたします。

配信期間

  • 2025年11月20日(木) 10時30分2025年11月30日(日) 16時30分

お申し込みの締切日

  • 2025年11月20日(木) 10時30分

プログラム

 これまでのAIは用意された膨大なデータセットからデータ間に潜む関係性を見出すことが中心的な役割でした。これに対して、最近はロボットやゲームAIなどのエージェントが自ら試行錯誤して得た経験データに基づいて学習して、目的を達成できる行動のルール (方策) を獲得する強化学習への注目が高まっています。
 これは明示的な正解データを用意せずとも、望ましい結果を定量的に表すことでユーザーが思いもしない優れた方策を見出す事例が数多く報告され、家電からロボットまで幅広い分野で期待が高まっています。
 本講座では、このような期待の技術である強化学習について、これまでのAIとは異なる学習方法が何故必要なのか?という根幹から、学習法の基礎を概説いたします。また、ロボットなどの機械制御への応用が特に期待される最新の強化学習アルゴリズムや、応用の際に悩みの種となりやすい報酬の設計指針や対処法についても実際の応用事例と合わせて紹介します。

  1. 強化学習とは
    1. 強化学習の目的
    2. マルコフ決定過程
    3. 学習すべき要素
  2. 学習アルゴリズムの基礎
    1. 価値関数の学習
    2. 方策関数の学習
    3. 深層強化学習でのテクニック
  3. 最新のActor-Criticアルゴリズム
    1. 改善へのエッセンス
    2. 方策更新の制限
      • TRPO
      • PPO
    3. 直接的な方策勾配の計算
      • DDPG
      • TD3
    4. 方策エントロピーの最大化
      • SQL
      • SAC
  4. モデルベース強化学習
    1. 世界モデルの学習
    2. 世界モデルの活用法
    3. 既存モデルの活用法
  5. 報酬設計の課題と対策
    1. 疎な報酬
    2. 多目的性
    3. エキスパートの模倣
    4. 学習難易度の調整
    • 質疑応答

講師

  • 小林 泰介
    国立情報学研究所 情報学プリンシプル研究系
    助教

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 50,000円 (税別) / 55,000円 (税込)
複数名
: 45,000円 (税別) / 49,500円 (税込)

複数名同時受講割引について

  • 2名様以上でお申込みの場合、1名あたり 45,000円(税別) / 49,500円(税込) で受講いただけます。
  • 5名様以降は、1名あたり 30,000円(税別) / 33,000円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 50,000円(税別) / 55,000円(税込)
    • 2名様でお申し込みの場合 : 2名で 90,000円(税別) / 99,000円(税込)
    • 3名様でお申し込みの場合 : 3名で 135,000円(税別) / 148,500円(税込)
    • 4名様でお申し込みの場合 : 4名で 180,000円(税別) / 198,000円(税込)
    • 5名様でお申し込みの場合 : 5名で 210,000円(税別) / 231,000円(税込)
  • 同一法人内による複数名同時申込みのみ適用いたします。
  • 請求書は、代表者にご送付いたします。
  • 他の割引は併用できません。

アカデミック割引

  • 1名様あたり 30,000円(税別) / 33,000円(税込)

日本国内に所在しており、以下に該当する方は、アカデミック割引が適用いただけます。

  • 学校教育法にて規定された国、地方公共団体、および学校法人格を有する大学、大学院、短期大学、附属病院、高等専門学校および各種学校の教員、生徒
  • 病院などの医療機関・医療関連機関に勤務する医療従事者
  • 文部科学省、経済産業省が設置した独立行政法人に勤務する研究者。理化学研究所、産業技術総合研究所など
  • 公設試験研究機関。地方公共団体に置かれる試験所、研究センター、技術センターなどの機関で、試験研究および企業支援に関する業務に従事する方
  • 支払名義が企業の場合は対象外とさせていただきます。
  • 企業に属し、大学、公的機関に派遣または出向されている方は対象外とさせていただきます。

アーカイブ配信セミナー

  • 当日のセミナーを、後日にお手元のPCやスマホ・タブレッドなどからご視聴・学習することができます。
  • 配信開始となりましたら、改めてメールでご案内いたします。
  • 視聴サイトにログインしていただき、ご視聴いただきます。
  • 視聴期間は2025年11月20日〜11月30日を予定しております。
    ご視聴いただけなかった場合でも期間延長いたしませんのでご注意ください。
  • セミナー資料は別途、送付いたします。

これから開催される関連セミナー

開始日時 会場 開催方法
2025/10/29 はじめての研究開発での機械学習活用と社内推進のポイント オンライン
2025/10/30 マテリアルズ・インフォマティクス入門 オンライン
2025/11/5 高分子材料の開発・設計における計算科学やAI・MI活用の最新動向 オンライン
2025/11/6 高分子材料の開発・設計における計算科学やAI・MI活用の最新動向 オンライン
2025/11/10 生成AIを活用した異常検知と判断の標準化、高精度化への活用 オンライン
2025/11/11 強化学習の基礎・発展と機械・ロボット制御への応用 オンライン
2025/11/11 生成AIを活用した異常検知と判断の標準化、高精度化への活用 オンライン
2025/11/12 機械設備投資の進め方 オンライン
2025/11/12 ラボオートメーションの導入、設計に向けた機器、装置の選定と制御のポイント オンライン
2025/11/13 工場自動化/省人化への生成AI、DX導入と活用のポイント オンライン
2025/11/14 深層学習を用いた少ないデータへの対処と精度向上のポイント オンライン
2025/11/14 永久磁石同期モータの位置センサレス制御 オンライン
2025/11/17 マテリアルズ・インフォマティクス入門 オンライン
2025/11/17 EMCの基礎と機械学習・深層学習の応用技術 オンライン
2025/11/17 リザバーコンピューティングの基礎と研究動向、社会実装に向けた技術課題と応用展開 オンライン
2025/11/18 スモールデータ解析の方法と実問題解決への応用 オンライン
2025/11/18 ベイズモデリングによる機械学習の理解と実践 オンライン
2025/11/18 EMCの基礎と機械学習・深層学習の応用技術 オンライン
2025/11/25 体表面における生体信号の低侵襲・非接触計測技術と応用 オンライン
2025/11/26 0からのAIエージェントとデータ分析 オンライン

関連する出版物

発行年月
2025/6/9 無人搬送システム〔2025年版〕 技術開発実態分析調査報告書 (CD-ROM版)
2025/6/9 無人搬送システム〔2025年版〕 技術開発実態分析調査報告書 (書籍版)
2024/10/31 少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発
2023/6/30 生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31 機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25 AIプロセッサー (CD-ROM版)
2021/10/25 AIプロセッサー
2021/7/30 マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/7/14 AIビジネスのブレークスルーと規制強化
2021/6/30 人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28 AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11 化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31 生体情報センシングと人の状態推定への応用
2020/4/30 生体情報計測による感情の可視化技術
2020/3/26 ビッグデータ・AIの利活用に伴う法的留意点
2019/1/31 センサフュージョン技術の開発と応用事例
2018/5/31 最先端医療機器の病院への普及展望と今後の製品開発
2018/5/31 “人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2017/7/27 ウェアラブル機器の開発とマーケット・アプリケーション・法規制動向
2015/6/26 2015年版 民生機器用蓄電池市場の実態と将来展望