技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

強化学習アルゴリズム入門

強化学習アルゴリズム入門

~「平均」からはじめる基礎と応用~
東京都 開催 会場 開催

開催日

  • 2019年7月23日(火) 10時30分 16時30分

プログラム

  1. 第1章 平均から学ぶ強化学習の基本概念
    1. はじめに
    2. 平均と期待値
    3. 平均と価値
    4. 平均とマルコフ性
    5. 平均によるベルマン方程式の導出
    6. 平均によるモンテカルロ学習手法の導出
    7. 平均によるTD法の導出
  2. 第2章 各アルゴリズムの特徴と応用
    1. はじめに
    2. 方策π (a | S)
    3. 動的計画法
    4. モンテカルロ法
    5. TD (0) 法
  3. 第3章 関数近似手法
    1. はじめに
    2. 関数近似の基本概念
    3. 関数近似モデルを用いたV (St) の表現
    4. 機械学習による価値関数の回帰
    5. モンテカルロ法を応用した価値関数回帰
    6. Td (0) – SARSA法を適用した行動状態価値関数の回帰
    7. Td (0) – Q法を応用した行動状態価値関数の回帰
  4. 第4章 深層強化学習の原理と手法
    1. TD – Q学習におけるNNによる行動価値関数回帰
    2. DQNによる行動状態価値関数近似
    3. 確率方策勾配法
    4. 決定型方策勾配法
    5. TRPO/PPO法
    6. まとめと展開

講師

  • 曽我部 東馬
    電気通信大学 i-パワードエネルギーシステム研究センター 基盤理工学専攻
    准教授

会場

中央大学 駿河台記念館
東京都 千代田区 神田駿河台3丁目11−5
中央大学 駿河台記念館の地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 46,000円 (税別) / 49,680円 (税込)
1口
: 57,000円 (税別) / 61,560円 (税込) (3名まで受講可)

テキストについて

テキストとして、「 機械学習アルゴリズム入門 」 (3,240円) を使用いたします。
テキストが必要な方は、お申し込みのテキスト希望欄から「必要」をご選択下さい。
受講料と、テキスト代(実費)を合わせて請求させていただきます。

本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2024/4/24 脳波計測・処理・解析・機械学習の基礎と応用および脳波データの活用方法 オンライン
2024/4/25 カルマンフィルタの実践 オンライン
2024/4/26 ExcelとPythonによる多変量解析 超入門 オンライン
2024/4/26 少ないデータに対する機械学習、深層学習の適用 オンライン
2024/4/26 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン
2024/5/2 脳波計測・処理・解析・機械学習の基礎と応用および脳波データの活用方法 オンライン
2024/5/8 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン
2024/5/17 スパース推定の本質の理解と実装応用技術への展開 オンライン
2024/5/23 ベイズ統計から学ぶ統計的機械学習 オンライン
2024/5/24 マテリアルインフォマティクスの材料開発への適用と活用事例 オンライン
2024/5/24 画像認識のためのディープラーニングとモデルの軽量化 オンライン
2024/5/27 機械学習による適応的実験計画 オンライン
2024/5/27 外観検査へのAI導入と生成AIによるトレーニングデータ不足への対応 オンライン
2024/5/31 マテリアルズインフォマティクスのためのデータ解析 オンライン
2024/6/13 エンジニアのための実験計画法とExcel上で構築可能な人工知能を併用する非線形実験計画法 オンライン
2024/6/14 機械学習による異常検知入門 東京都 会場
2024/6/18 機械学習/AIによる特許調査の高度化で実践するスマート特許戦略 オンライン
2024/6/18 Pythonではじめる機械学習入門講座 オンライン
2024/6/20 ISO 13485:2016対応に必須の医療機器プロセスバリデーション (進め方、統計的手法とそのサンプルサイズ) オンライン
2024/6/24 外観検査の自動化の進め方と画像データ取得およびAIによる検査のポイント オンライン