技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

強化学習入門

強化学習入門

~基本理論と深層強化学習、ソフトコンピューティングによる展開~
東京都 開催 会場 開催

開催日

  • 2020年2月7日(金) 13時00分17時00分

受講対象者

  • 人工知能技術、強化学習に興味のある方
  • 強化学習技術の応用を検討されている方

修得知識

  • 強化学習の基本理論と基礎技術
  • 深層学習の基本理論と基礎技術
  • 強化学習の概念
  • 強化学習の応用

予備知識

  • 大学初年次程度の数学の知識
  • コンピュータ・コンピュータプログラムの基礎知識

プログラム

 AI (人工知能) の応用が今後益々重要な課題となってきます。そのきっかけとなったのが、深層学習の成功とAlpha GO (コンピュータ) が囲碁のプロに勝利したことです。
 本講座では、このような技術の流れを決定づけたAlpha GOでも中心的役割を担う技術として導入されている強化学習の基本理論と深層強化学習、実際の応用に繋げる上での有望な技術としてソフトコンピューティングによる展開を学んでいきます。

  1. 強化学習の理論
    1. 強化学習の背景
      1. その歴史と制御技術との関係
      2. n本腕バンディッド
    2. 機械学習としての強化学習
      1. 機械学習の概要
      2. 教師付学習、自己組織化、強化学習
    3. エージェントモデル
      1. 環境と報酬
      2. 探索と知識利用の実現
      3. 行動モデル
      4. イプシロンGreedy
      5. ボルツマン分布の利用
      6. マルチエージェント
    4. マルコフ決定過程
    5. 価値関数
      1. 行動価値関数
      2. 状態価値関数
    6. 報酬と部分報酬
      1. 期待報酬
    7. モンテカルロ法
    8. 動的計画法との関係
    9. TD学習
      1. Q学習
      2. SARSA学習
      3. 適格度トレース
    10. Profit Sharing
    11. Policy – based method
    12. Actor – Critic
  2. 深層強化学習
    1. ニューラルネットワークの基礎
      1. ニューロンモデル
      2. パーセプトロン
    2. 多層パーセプトロン
    3. モジュラーニューラルネットワーク
    4. 深層学習
    5. Deep Q – Network (DQN)
    6. Pythonによる実装
  3. ソフトコンピューティングによる展開
    1. 強化学習システム実装における課題
      1. 状態表現における次元の呪い
      2. 試行回数の低減
    2. ファジィ理論の基礎
    3. ファジィQ – 学習
    4. 階層型強化学習
      1. タスクの分割
      2. 追跡問題の実装
    5. ロバスト推定技術への応用
      1. コンピュータビジョンのためのモデリング
      2. 強化学習の応用

講師

  • 渡邊 俊彦
    大阪電気通信大学 工学部 電気電子工学科
    教授

会場

株式会社オーム社 オームセミナー室
東京都 千代田区 神田錦町3-1
株式会社オーム社 オームセミナー室の地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 43,000円 (税別) / 47,300円 (税込)
1口
: 56,000円 (税別) / 61,600円 (税込) (3名まで受講可)
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2025/9/4 特許調査への生成AIの活用 オンライン
2025/9/8 ベイズ統計と機械学習の実践と応用 オンライン
2025/9/9 スパースモデリング、ベイズ最適化の基礎と少ないデータを補うための応用ポイント オンライン
2025/9/9 ベイズ統計と機械学習の実践と応用 オンライン
2025/9/12 要素技術者による人工知能応用開発入門 オンライン
2025/9/12 深層学習、計算機シミュレーションの基礎とシステムのモデル化技術 オンライン
2025/9/16 要素技術者による人工知能応用開発入門 オンライン
2025/9/16 自動運転・運転支援のためのミリ波レーダの基礎と車載応用、走行環境認識技術 オンライン
2025/9/16 特許調査への生成AIの活用 オンライン
2025/9/16 ケモインフォマティクスと機械学習による化学データ解析 オンライン
2025/9/17 自動運転・運転支援のためのミリ波レーダの基礎と車載応用、走行環境認識技術 オンライン
2025/9/17 ケモインフォマティクスと機械学習による化学データ解析 オンライン
2025/9/19 説明可能AI (XAI) から人と共に進化・発展するAIへ オンライン
2025/9/19 スパースモデリング、ベイズ最適化の基礎と少ないデータを補うための応用ポイント オンライン
2025/9/22 深層学習、計算機シミュレーションの基礎とシステムのモデル化技術 オンライン
2025/9/22 ラボオートメーション (実験自動化) による研究開発効率向上の実践的アプローチ オンライン
2025/9/24 FT-IRの基礎と機械学習によるスペクトルデータ解析 オンライン
2025/9/26 プロセスインフォマティクスの基礎と製造プロセスへの効果的な活かし方 オンライン
2025/9/28 Vision Transformerの仕組みとBEV Perception オンライン
2025/9/29 生成AIの著作権侵害問題とトラブル対策 オンライン