技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

強化学習の基礎・発展と機械・ロボット制御への応用

強化学習の基礎・発展と機械・ロボット制御への応用

~強化学習法の基礎、応用に向けた報酬の設計指針や対処法について解説~
オンライン 開催

アーカイブ配信で受講をご希望の場合、視聴期間は2025年11月20日〜11月30日を予定しております。
アーカイブ配信のお申し込みは2025年11月20日まで承ります。

概要

本セミナーでは、強化学習について基礎から解説し、ロボットなどの機械制御への応用が特に期待される最新の強化学習アルゴリズムや、応用の際に悩みの種となりやすい報酬の設計指針や対処法について実際の応用事例と合わせて紹介いたします。

開催日

  • 2025年11月11日(火) 10時30分16時30分

プログラム

 これまでのAIは用意された膨大なデータセットからデータ間に潜む関係性を見出すことが中心的な役割でした。これに対して、最近はロボットやゲームAIなどのエージェントが自ら試行錯誤して得た経験データに基づいて学習して、目的を達成できる行動のルール (方策) を獲得する強化学習への注目が高まっています。
 これは明示的な正解データを用意せずとも、望ましい結果を定量的に表すことでユーザーが思いもしない優れた方策を見出す事例が数多く報告され、家電からロボットまで幅広い分野で期待が高まっています。
 本講座では、このような期待の技術である強化学習について、これまでのAIとは異なる学習方法が何故必要なのか?という根幹から、学習法の基礎を概説いたします。また、ロボットなどの機械制御への応用が特に期待される最新の強化学習アルゴリズムや、応用の際に悩みの種となりやすい報酬の設計指針や対処法についても実際の応用事例と合わせて紹介します。

  1. 強化学習とは
    1. 強化学習の目的
    2. マルコフ決定過程
    3. 学習すべき要素
  2. 学習アルゴリズムの基礎
    1. 価値関数の学習
    2. 方策関数の学習
    3. 深層強化学習でのテクニック
  3. 最新のActor-Criticアルゴリズム
    1. 改善へのエッセンス
    2. 方策更新の制限
      • TRPO
      • PPO
    3. 直接的な方策勾配の計算
      • DDPG
      • TD3
    4. 方策エントロピーの最大化
      • SQL
      • SAC
  4. モデルベース強化学習
    1. 世界モデルの学習
    2. 世界モデルの活用法
    3. 既存モデルの活用法
  5. 報酬設計の課題と対策
    1. 疎な報酬
    2. 多目的性
    3. エキスパートの模倣
    4. 学習難易度の調整
    • 質疑応答

講師

  • 小林 泰介
    国立情報学研究所 情報学プリンシプル研究系
    助教

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 50,000円 (税別) / 55,000円 (税込)
複数名
: 45,000円 (税別) / 49,500円 (税込)

複数名同時受講割引について

  • 2名様以上でお申込みの場合、1名あたり 45,000円(税別) / 49,500円(税込) で受講いただけます。
  • 5名様以降は、1名あたり 30,000円(税別) / 33,000円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 50,000円(税別) / 55,000円(税込)
    • 2名様でお申し込みの場合 : 2名で 90,000円(税別) / 99,000円(税込)
    • 3名様でお申し込みの場合 : 3名で 135,000円(税別) / 148,500円(税込)
    • 4名様でお申し込みの場合 : 4名で 180,000円(税別) / 198,000円(税込)
    • 5名様でお申し込みの場合 : 5名で 210,000円(税別) / 231,000円(税込)
  • 同一法人内による複数名同時申込みのみ適用いたします。
  • 請求書は、代表者にご送付いたします。
  • 他の割引は併用できません。

アカデミック割引

  • 1名様あたり 30,000円(税別) / 33,000円(税込)

日本国内に所在しており、以下に該当する方は、アカデミック割引が適用いただけます。

  • 学校教育法にて規定された国、地方公共団体、および学校法人格を有する大学、大学院、短期大学、附属病院、高等専門学校および各種学校の教員、生徒
  • 病院などの医療機関・医療関連機関に勤務する医療従事者
  • 文部科学省、経済産業省が設置した独立行政法人に勤務する研究者。理化学研究所、産業技術総合研究所など
  • 公設試験研究機関。地方公共団体に置かれる試験所、研究センター、技術センターなどの機関で、試験研究および企業支援に関する業務に従事する方
  • 支払名義が企業の場合は対象外とさせていただきます。
  • 企業に属し、大学、公的機関に派遣または出向されている方は対象外とさせていただきます。

ライブ配信対応セミナー / アーカイブ配信対応セミナー

  • 「Zoom」を使ったライブ配信またはアーカイブ配信セミナーのいずれかをご選択いただけます。
  • お申し込み前に、 Zoomのシステム要件テストミーティングへの参加手順 をご確認いただき、 テストミーティング にて動作確認をお願いいたします。
  • 開催日前に、接続先URL、ミーティングID​、パスワードを別途ご連絡いたします。
  • セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
  • ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
  • タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
  • ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
  • 講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。

ライブ配信セミナーをご希望の場合

  • セミナー資料は、郵送にて前日までにお送りいたします。
  • 開催まで4営業日を過ぎたお申込みの場合、セミナー資料の到着が、開講日に間に合わない可能性がありますこと、ご了承下さい。
    ライブ配信の画面上でスライド資料は表示されますので、セミナー視聴には差し支えございません。
    印刷物は後日お手元に届くことになります。
  • Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
    万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。

アーカイブ配信セミナーをご希望の場合

  • 当日のセミナーを、後日にお手元のPCやスマホ・タブレッドなどからご視聴・学習することができます。
  • 配信開始となりましたら、改めてメールでご案内いたします。
  • 視聴サイトにログインしていただき、ご視聴いただきます。
  • 視聴期間は2025年11月20日〜11月30日を予定しております。
    ご視聴いただけなかった場合でも期間延長いたしませんのでご注意ください。
  • セミナー資料は別途、送付いたします。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2026/1/19 マテリアルズ・インフォマティクスの実践と低誘電材料開発への応用 オンライン
2026/1/19 EMCの基礎と機械学習・深層学習の応用技術 オンライン
2026/1/20 EMCの基礎と機械学習・深層学習の応用技術 オンライン
2026/1/26 機械学習と脳科学におけるベイズ統計 オンライン
2026/1/26 外観検査 (2日間) オンライン
2026/1/26 AI外観検査 (画像認識) のはじめ方、すすめ方、精度の向上 オンライン
2026/1/27 AIの選択・精度・効率・構造・コストなどの最適化原理 オンライン
2026/1/27 時系列データ分析 入門 : 基礎とExcelでの実行方法 オンライン
2026/1/28 ディジタルフィルタを理解する オンライン
2026/1/28 データ分析およびAIエージェントの基礎と活用に向けたポイント オンライン
2026/1/30 AI・IoT時代の生産現場を支えるデジタル信号処理の基礎と実践応用テクニック オンライン
2026/2/2 AI・IoT時代の生産現場を支えるデジタル信号処理の基礎と実践応用テクニック オンライン
2026/2/4 AI外観検査の導入プロセスと実践ノウハウ オンライン
2026/2/5 AI外観検査の導入プロセスと実践ノウハウ オンライン
2026/2/6 データ分析およびAIエージェントの基礎と活用に向けたポイント オンライン
2026/2/10 制御のためのシステム同定 (アドバンスト編) オンライン
2026/2/13 AI外観検査 (画像認識) のはじめ方、すすめ方、精度の向上 オンライン
2026/2/17 時系列データ解析の基礎と進め方のポイント オンライン
2026/2/18 プラスチックリサイクルの国内外の現状とリサイクル技術 オンライン
2026/2/19 プラスチックリサイクルの国内外の現状とリサイクル技術 オンライン

関連する出版物

発行年月
2025/6/9 無人搬送システム〔2025年版〕 技術開発実態分析調査報告書 (書籍版)
2025/6/9 無人搬送システム〔2025年版〕 技術開発実態分析調査報告書 (CD-ROM版)
2024/10/31 少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発
2023/6/30 生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31 機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25 AIプロセッサー (CD-ROM版)
2021/10/25 AIプロセッサー
2021/7/30 マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/6/30 人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28 AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11 化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31 生体情報センシングと人の状態推定への応用
2020/4/30 生体情報計測による感情の可視化技術
2019/1/31 センサフュージョン技術の開発と応用事例
2018/5/31 “人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2018/5/31 最先端医療機器の病院への普及展望と今後の製品開発
2017/7/27 ウェアラブル機器の開発とマーケット・アプリケーション・法規制動向
2015/6/26 2015年版 民生機器用蓄電池市場の実態と将来展望
2014/9/25 サービスロボット 技術開発実態分析調査報告書 (CD-ROM版)
2014/9/25 サービスロボット 技術開発実態分析調査報告書