技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

強化学習の基礎と実践

強化学習の基礎と実践

東京都 開催 会場 開催 PC実習付き

概要

本セミナーでは、強化学習の基礎理論と基本アルゴリズムについて解説し、LEGOロボットを用いたデモ、最近の研究動向、最新の応用事例を紹介し、強化学習ライブラリーのOpenAI gymを用いた実習を行います。

開催日

  • 2019年12月26日(木) 10時30分 16時30分

修得知識

  • 強化学習の基礎理論
  • 強化学習の基本アルゴリズム
  • 実際に強化学習を試してみることができる

プログラム

 2016年、Googleが買収したDeepMind社が開発したコンピューター囲碁プログラムAlpha Goが囲碁の世界チャンピオンに勝利して話題となった。このAlpha Goの学習に用いられていたのが深層学習 (ディープ・ラーニング) と強化学習を組み合わせたDeep Q-Network (DQN) である。
 本セミナーでは、強化学習の基礎理論と基本アルゴリズムについて解説し、LEGOロボットを用いたデモ、最近の研究動向、最新の応用事例を紹介し、強化学習ライブラリーのOpenAI gymを用いた実習を行う。

  1. はじめに
    1. 強化学習研究の歴史
    2. 強化学習研究の動向
    3. デモ (迷路)
  2. 強化学習の基礎
    1. 強化学習の枠組み
    2. マルコフ決定過程 (MDPs)
    3. 決定的環境と確率的環境
    4. エージェントの目的
    5. 行動価値
    6. 学習エージェントの行動選択法
      1. 一様ランダム選択
      2. グリーディー選択
      3. ε-グリーディー選択
      4. ソフトマックス選択
    7. 探査と知識利用のジレンマ
  3. 基本的な強化学習アルゴリズム
    1. 行動価値推定型
      1. Q学習
      2. Sarsa
    2. 方策最適化型
      1. Policy Gradient
    3. 行動価値推定型
      1. Profit Sharing (PS)
      2. OnPS
  4. 強化学習パラメーターのチューニング
    1. 状態のチューニング
    2. 行動のチューニング
    3. 報酬関数のチューニング
    4. 割引率のチューニング
    5. ステップあたりの時間のチューニング
    6. ステップサイズのチューニング
    7. ε-グリーディー選択におけるεのチューニング
    8. ソフトマックス選択における温度のチューニング
    9. 行動価値の初期値のチューニング
  5. 実環境への応用する際の課題
    1. マルチエージェント強化学習
    2. 関数近似
    3. 部分観測マルコフ決定過程 (POMDPs)
  6. 最新の強化学習
    1. 多目的強化学習
    2. 逆強化学習
    3. 安全な強化学習
    4. マルコフ決定過程簡約化
    5. 複利型強化学習
    6. 深層強化学
      1. Deep Q-Network (DQN)
      2. A3C
      3. TRPO
      4. PPO
  7. OpenAI gym実習
    1. OpenAIとgym
    2. 環境構築
    3. サンプルプログラムの実行
  8. 応用事例
    1. 複利型強化学習の応用事例
      1. 国債銘柄選択
      2. ブラックジャック
      3. 株取引
      4. 日本国債取引
    2. 深層強化学習の応用事例
      1. ロボットアーム
      2. 自動運転車
      3. ドローン
  9. まとめ
    • 質疑応答

会場

江東区産業会館

第6展示室

東京都 江東区 東陽4丁目5-18
江東区産業会館の地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 50,000円 (税別) / 55,000円 (税込)
複数名
: 25,000円 (税別) / 27,500円 (税込) (案内をご希望の場合に限ります)

案内割引・複数名同時申込割引について

R&D支援センターからの案内登録をご希望の方は、割引特典を受けられます。
案内および割引をご希望される方は、お申込みの際、「案内の希望 (割引適用)」の欄から案内方法をご選択ください。
複数名で同時に申込いただいた場合、1名様につき 25,000円(税別) / 27,500円(税込) で受講いただけます。

  • R&D支援センターからの案内を希望する方
    • 1名様でお申し込みの場合 : 1名で 45,000円(税別) / 49,500円(税込)
    • 2名様でお申し込みの場合 : 2名で 50,000円(税別) / 55,000円(税込)
    • 3名様でお申し込みの場合 : 3名で 75,000円(税別) / 82,500円(税込)
  • R&D支援センターからの案内を希望しない方
    • 1名様でお申し込みの場合 : 1名で 50,000円(税別) / 55,000円(税込)
    • 2名様でお申し込みの場合 : 2名で 100,000円(税別) / 110,000円(税込)
    • 3名様でお申し込みの場合 : 3名で 150,000円(税別) / 165,000円(税込)
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2024/4/24 脳波計測・処理・解析・機械学習の基礎と応用および脳波データの活用方法 オンライン
2024/4/25 カルマンフィルタの実践 オンライン
2024/4/26 ExcelとPythonによる多変量解析 超入門 オンライン
2024/4/26 少ないデータに対する機械学習、深層学習の適用 オンライン
2024/4/26 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン
2024/5/2 脳波計測・処理・解析・機械学習の基礎と応用および脳波データの活用方法 オンライン
2024/5/8 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン
2024/5/17 スパース推定の本質の理解と実装応用技術への展開 オンライン
2024/5/23 ベイズ統計から学ぶ統計的機械学習 オンライン
2024/5/24 マテリアルインフォマティクスの材料開発への適用と活用事例 オンライン
2024/5/24 画像認識のためのディープラーニングとモデルの軽量化 オンライン
2024/5/27 機械学習による適応的実験計画 オンライン
2024/5/27 外観検査へのAI導入と生成AIによるトレーニングデータ不足への対応 オンライン
2024/5/31 マテリアルズインフォマティクスのためのデータ解析 オンライン
2024/6/12 デジタル時代のヘルスケアビジネスの立ち上げ方 東京都 会場・オンライン
2024/6/13 エンジニアのための実験計画法とExcel上で構築可能な人工知能を併用する非線形実験計画法 オンライン
2024/6/14 機械学習による異常検知入門 東京都 会場
2024/6/18 機械学習/AIによる特許調査の高度化で実践するスマート特許戦略 オンライン
2024/6/18 Pythonではじめる機械学習入門講座 オンライン
2024/6/20 ISO 13485:2016対応に必須の医療機器プロセスバリデーション (進め方、統計的手法とそのサンプルサイズ) オンライン