技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

基礎からわかる強化学習

基礎からわかる強化学習

~Q学習からAlphaGo Zeroまで~
東京都 開催 会場 開催

開催日

  • 2018年7月9日(月) 10時30分16時30分

修得知識

  • 強化学習の問題
  • 様々な学習方法 (伝統的なQ学習から最新のAlphaGo Zeroまで)
  • 実際の問題に対して強化学習を応用する方法

プログラム

  1. 強化学習の例示 (デモンストレーション)
    1. 最短経路探索
    2. ゲームプレイ
    3. 二足歩行
  2. 強化学習問題
    1. 学習エージェントと環境
    2. 問題の定義
    3. 例題:最短経路探索と二足歩行
  3. 表形式の強化学習法
    1. 価値関数
    2. 行動選択法
    3. 学習法:TD、Q学習、Sarsa、モンテカルロ木探索
  4. 近似を用いる強化学習法
    1. 価値関数の近似:放射基底関数、ニューラルネットワーク
    2. 勾配法
    3. 価値勾配を用いる学習法
    4. 方策勾配を用いる学習法
  5. 深層強化学習法
    1. 深層学習 (ディープラーニング)
    2. ビデオゲームに対する学習法
    3. 囲碁に対する学習法:AlphaGoとAlphaGo Zero
  6. 実際の応用における強化学習の使い方

講師

  • 飯間 等
    京都工芸繊維大学 情報工学・人間科学系
    准教授

会場

株式会社オーム社 オームセミナー室
東京都 千代田区 神田錦町3-1
株式会社オーム社 オームセミナー室の地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 46,000円 (税別) / 49,680円 (税込)
1口
: 57,000円 (税別) / 61,560円 (税込) (3名まで受講可)
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2026/3/31 Pythonで学ぶデータ解析・機械学習を理解するための線形代数入門 オンライン
2026/4/10 データ駆動型の化学・材料関連研究の最新動向と小規模データの活かし方 オンライン
2026/4/15 Pythonと生成AI/AIエージェントによるデータ分析入門 オンライン
2026/4/15 生成AI時代のPythonデータ分析 オンライン
2026/4/16 MI, 生成AIを活用した材料開発の高速化、効率化 オンライン
2026/4/16 第一原理計算とLightGBMを活用したマテリアルデータエンジニアリングとその活用事例 オンライン
2026/4/16 生成AI時代のPythonデータ分析 オンライン
2026/4/17 因子ごとの最適条件を少ない実験回数で見つける統計的手法「実験計画法」 & 汎用的インフォマティクス「非線形実験計画法」 オンライン
2026/4/22 AI搭載システムの品質・安全保証技術と検証のポイント オンライン
2026/4/23 AI搭載システムの品質・安全保証技術と検証のポイント オンライン
2026/4/23 AI/機械学習が「遅い・重い・回らない」ボトルネックの原因と対処法 オンライン
2026/4/24 統計的組合せ最適化 : 実験計画法とプログラミング不要のAIを使った汎用的インフォマティクス : 非線形実験計画法実践入門 オンライン
2026/4/24 AI/機械学習が「遅い・重い・回らない」ボトルネックの原因と対処法 オンライン
2026/5/11 機械学習原子間ポテンシャルの基礎と構築法 オンライン
2026/5/13 AIエージェントの基礎と業務導入のポイント オンライン
2026/5/20 機械学習原子間ポテンシャルの基礎と構築法 オンライン
2026/5/22 AIエージェントの基礎と業務導入のポイント オンライン
2026/5/28 材料・分析データに活かすためのケモメトリクスの基礎と実践 オンライン
2026/6/19 実機データでつくるAI制御モデル オンライン