技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

基礎から学べる強化学習

Zoomを使ったライブ配信セミナー

基礎から学べる強化学習

~アルゴリズムの基本原理から応用例まで~
オンライン 開催

概要

本セミナーでは、簡単な例題やプログラム演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性を紹介いたします。

開催日

  • 2020年12月16日(水) 13時00分17時00分

修得知識

  • 強化学習の基礎知識と応用例
  • Pythonによる強化学習アルゴリズムの実装方法
  • 強化学習モデルを利用したヒトや動物の行動解析法

プログラム

 強化学習とは環境とのインタラクションを通して試行錯誤的に最適な戦略や行動選択則を獲得する機械学習法の枠組みです。囲碁や将棋の世界では、人工知能が人間エキスパートを超えるようになり世の中を驚かせましたが、それには強化学習が大きな貢献を果たしました。では、強化学習を使えば何でもできるのでしょうか?それとも、強化学習にも苦手な応用分野はあるのでしょうか? それを知るには強化学習の基本原理を理解する必要があります。
 本セミナーでは、簡単な例題やプログラム演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性をご紹介したいと思います。

  1. はじめに
    1. 例題から学ぶ機械学習と強化学習の位置づけ
    2. 強化学習の歴史
  2. 強化学習の基礎理論
    1. マルコフ決定過程による問題の定式化とその解法
    2. マルコフ決定過程
    3. 価値反復法
    4. 方策反復法
    5. 代表的な強化学習アルゴリズム
    6. モンテカルロ法
    7. TD学習法
    8. Q学習法
    9. SARSA法
    10. モデル同定型強化学習法
    11. アルゴリズム実装時に生じる諸問題とその解決法
    12. 探索と知識利用のジレンマ
    13. メタ学習
    14. 連続空間・高次元空間への対応とDQN
  3. プログラミング演習:Pythonによる強化学習アルゴリズムの実装
  4. 強化学習の応用例
    1. ロボットの自動制御
    2. ゲームエージェントの学習
    3. 脳の意思決定モデルと行動解析

講師

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 43,000円 (税別) / 47,300円 (税込)
1口
: 56,000円 (税別) / 61,600円 (税込) (3名まで受講可)
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2026/2/17 時系列データ解析の基礎と進め方のポイント オンライン
2026/2/24 産業設備の保全/管理へのAI・機械学習の活用と実践ノウハウ オンライン
2026/2/24 機械学習原子間ポテンシャル (MLIP) の基礎と実践的活用法 オンライン
2026/2/25 AIエージェント×ビジネスデータ分析の基礎と実践 オンライン
2026/2/25 データ分析のポイントと生成AIの活用 オンライン
2026/2/26 AIエージェント×ビジネスデータ分析の基礎と実践 オンライン
2026/2/26 生成AIによる特許調査・分析の現状と実務への適用 オンライン
2026/2/26 生成AIを活用した研究データ解析と可視化手法 オンライン
2026/2/26 マテリアルズインフォマティクスの動向と少ないデータへの適用事例 オンライン
2026/2/27 時系列データ解析の基礎と進め方のポイント オンライン
2026/2/27 未知の不良や異常も検知する検査・センシング・モニタリングに適した人工知能 オンライン
2026/3/2 未知の不良や異常も検知する検査・センシング・モニタリングに適した人工知能 オンライン
2026/3/2 マテリアルズインフォマティクスの動向と少ないデータへの適用事例 オンライン
2026/3/5 産業設備の保全/管理へのAI・機械学習の活用と実践ノウハウ オンライン
2026/3/9 生成AIによる特許調査・分析の現状と実務への適用 オンライン
2026/3/10 Pythonを用いた高分子材料の画像解析入門 オンライン
2026/3/13 開発・生産現場で諸課題を解決に導くデータ駆動型手法 / ディープニューラルネットワークモデル / MTシステムの基礎と応用 オンライン
2026/3/16 小規模実験の自動化による研究開発の効率化と再現性向上 オンライン
2026/3/31 Pythonで学ぶデータ解析・機械学習を理解するための線形代数入門 オンライン
2026/4/17 因子ごとの最適条件を少ない実験回数で見つける統計的手法「実験計画法」 & 汎用的インフォマティクス「非線形実験計画法」 オンライン