技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

強化学習の基礎とその使い方

強化学習の基礎とその使い方

~Q学習から深層強化学習 AlphaGo Zeroまで~
東京都 開催 会場 開催 デモ付き

概要

本セミナーでは、機械学習・強化学習について基礎から解説し、学習エージェントと環境、アルゴリズム、深層強化学習について分かりやすく解説いたします。

開催日

  • 2018年12月18日(火) 10時00分17時00分

修得知識

  • 強化学習の問題
  • 様々な学習方法 (伝統的なQ学習から最新のAlphaGo Zeroまで)
  • 実際の問題に対して強化学習を応用する方法

プログラム

 人工知能分野では、プロ棋士の経験に基づいて囲碁の打ち方を学習するAlphaGoが一昨年に大きな話題となり、続いてこれを上回るAlphaGo Zeroが昨年提案されました。AlphaGo Zeroは深層強化学習という最先端技術を用いることでプロ棋士の経験を全く使用せずに学習できること、また応用分野が限定されておらず、どのような分野でも適用可能であることから世界中のあらゆる分野で注目を集めております。
 本講演では、このように注目を集めて続けている強化学習を基礎から平易に解説します。学習の方法について、伝統的で幅広く用いられているQ学習から最新の深層強化学習まで、様々な学習法を紹介します。例を用い、また練習問題を解くことで理解を深めます。

  1. 強化学習の例示 (デモンストレーション)
    1. 最短経路探索
    2. ゲームプレイ
    3. 二足歩行
  2. 強化学習問題
    1. 学習エージェントと環境
    2. 問題の定義
    3. 設定例
  3. 表形式の強化学習法
    1. 価値関数
    2. 行動選択法
    3. 伝統的な学習法
      • Q学習
      • Sarsa
  4. 近似を用いる強化学習法
    1. 価値関数の近似
      • 放射基底関数
      • ニューラルネットワーク
    2. 勾配法
    3. 価値勾配を用いる学習法
    4. 方策勾配を用いる学習法
  5. 人間を超える学習法:深層強化学習
    1. 深層学習 (ディープラーニング)
    2. ビデオゲームに対する学習法
    3. 囲碁に対する学習法: AlphaGoとAlphaGoZero
    • 質疑応答

講師

  • 飯間 等
    京都工芸繊維大学 情報工学・人間科学系
    准教授

会場

株式会社 技術情報協会
東京都 品川区 西五反田2-29-5 日幸五反田ビル8F
株式会社 技術情報協会の地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 50,000円 (税別) / 54,000円 (税込)
複数名
: 45,000円 (税別) / 48,600円 (税込)

複数名同時受講割引について

  • 2名様以上でお申込みの場合、
    1名あたり 45,000円(税別) / 48,600円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 50,000円(税別) / 54,000円(税込)
    • 2名様でお申し込みの場合 : 2名で 90,000円(税別) / 97,200円(税込)
    • 3名様でお申し込みの場合 : 3名で 135,000円(税別) / 145,800円(税込)
  • 同一法人内による複数名同時申込みのみ適用いたします。
  • 受講券、請求書は、代表者にご郵送いたします。
  • 他の割引は併用できません。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2026/4/10 データ駆動型の化学・材料関連研究の最新動向と小規模データの活かし方 オンライン
2026/4/15 Pythonと生成AI/AIエージェントによるデータ分析入門 オンライン
2026/4/15 生成AI時代のPythonデータ分析 オンライン
2026/4/16 MI, 生成AIを活用した材料開発の高速化、効率化 オンライン
2026/4/16 第一原理計算とLightGBMを活用したマテリアルデータエンジニアリングとその活用事例 オンライン
2026/4/16 生成AI時代のPythonデータ分析 オンライン
2026/4/17 因子ごとの最適条件を少ない実験回数で見つける統計的手法「実験計画法」 & 汎用的インフォマティクス「非線形実験計画法」 オンライン
2026/4/22 AI搭載システムの品質・安全保証技術と検証のポイント オンライン
2026/4/23 AI搭載システムの品質・安全保証技術と検証のポイント オンライン
2026/4/23 AI/機械学習が「遅い・重い・回らない」ボトルネックの原因と対処法 オンライン
2026/4/24 統計的組合せ最適化 : 実験計画法とプログラミング不要のAIを使った汎用的インフォマティクス : 非線形実験計画法実践入門 オンライン
2026/4/24 AI/機械学習が「遅い・重い・回らない」ボトルネックの原因と対処法 オンライン
2026/4/24 外観検査の自動化における画像認識の基礎と生成AI活用の最新動向 オンライン
2026/4/27 外観検査の自動化における画像認識の基礎と生成AI活用の最新動向 オンライン
2026/5/11 機械学習原子間ポテンシャルの基礎と構築法 オンライン
2026/5/13 AIエージェントの基礎と業務導入のポイント オンライン
2026/5/15 化学工学における小規模データ + ニューラルネットワークの活用手法 オンライン
2026/5/18 化学工学における小規模データ + ニューラルネットワークの活用手法 オンライン
2026/5/20 機械学習原子間ポテンシャルの基礎と構築法 オンライン
2026/5/22 AIエージェントの基礎と業務導入のポイント オンライン