技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

強化学習の基礎とPythonによるアルゴリズム実装

強化学習の基礎とPythonによるアルゴリズム実装

~例題やPythonを用いたプログラミング演習を通して、強化学習がうまく働く仕組みや応用例を学ぶ~
東京都 開催 会場 開催 PC実習付き

概要

本セミナーでは、簡単な例題やプログラム演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性を紹介いたします。

開催日

  • 2020年3月30日(月) 10時30分 16時30分

修得知識

  • 強化学習を用いた研究開発に必要な基礎知識
  • Python (Jupyter Notebook) を用いた強化学習アルゴリズムの実装方法
  • 強化学習モデルを利用したヒトや動物の行動解析法

プログラム

 強化学習とは環境とのインタラクションを通して試行錯誤的に最適な戦略や行動選択則を獲得する機械学習法の枠組みです。囲碁や将棋の世界では、人工知能が人間エキスパートを超えるようになり世の中を驚かせましたが、それには強化学習が大きな貢献を果たしました。では、強化学習を使えば何でもできるのでしょうか?それとも、強化学習にも苦手な応用分野はあるのでしょうか?それを知るには強化学習の基本原理を理解する必要があります。
 本講演では、簡単な例題やPythonを用いたプログラミング演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性をご紹介したいと思います。

  1. はじめに
    1. 例題から学ぶ機械学習と強化学習の位置づけ
    2. 強化学習の歴史
  2. 強化学習の基礎理論
    1. マルコフ決定過程による問題の定式化とその解法
      1. マルコフ決定過程
      2. 価値反復法
      3. 方策反復法
    2. 代表的な強化学習アルゴリズム
      1. モンテカルロ法
      2. TD学習法
      3. Q学習法
      4. SARSA法
      5. モデル同定型強化学習法
    3. アルゴリズム実装時に生じる諸問題とその解決法
      1. 探索と知識利用のジレンマ
      2. メタ学習
      3. 連続空間・高次元空間への対応とDQN
  3. プログラミング演習:Pythonによる強化学習アルゴリズムの実装
    (※各項目の合間に演習も織り交ぜます)
  4. 強化学習の応用例
    1. ロボットの自動制御
    2. 脳の意思決定モデルと行動解析
    • 質疑応答・名刺交換

講師

  • 吉本 潤一郎
    奈良先端科学技術大学院大学 先端科学技術研究科 情報科学領域
    准教授

会場

品川区立総合区民会館 きゅりあん

5F 第3講習室

東京都 品川区 東大井5丁目18-1
品川区立総合区民会館 きゅりあんの地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 42,750円 (税別) / 47,020円 (税込)
複数名
: 22,500円 (税別) / 24,750円 (税込)

複数名同時受講の割引特典について

  • 2名様以上でお申込みの場合、
    1名あたり 22,500円(税別) / 24,750円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 42,750円(税別) / 47,020円(税込)
    • 2名様でお申し込みの場合 : 2名で 45,000円(税別) / 49,500円(税込)
    • 3名様でお申し込みの場合 : 3名で 67,500円(税別) / 74,250円(税込)
  • 同一法人内 (グループ会社でも可) による複数名同時申込みのみ適用いたします。
  • 受講券、請求書は、代表者にご郵送いたします。
  • 請求書および領収書は1名様ごとに発行可能です。
    申込みフォームの通信欄に「請求書1名ごと発行」と記入ください。
  • 他の割引は併用できません。

アカデミー割引

教員、学生および医療従事者はアカデミー割引価格にて受講いただけます。

  • 1名様あたり 10,000円(税別) / 11,000円(税込)
  • 企業に属している方(出向または派遣の方も含む)は、対象外です。
  • お申込み者が大学所属名でも企業名義でお支払いの場合、対象外です。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2024/4/24 脳波計測・処理・解析・機械学習の基礎と応用および脳波データの活用方法 オンライン
2024/4/24 技術者・研究者のための多変量解析入門講座 オンライン
2024/4/25 カルマンフィルタの実践 オンライン
2024/4/26 ExcelとPythonによる多変量解析 超入門 オンライン
2024/4/26 少ないデータに対する機械学習、深層学習の適用 オンライン
2024/4/26 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン
2024/4/26 ChatGPTを活用したPythonプログラミングとコード生成 オンライン
2024/5/2 脳波計測・処理・解析・機械学習の基礎と応用および脳波データの活用方法 オンライン
2024/5/8 実験計画法・ベイズ最適化を用いた効率的な実験デザイン オンライン
2024/5/8 AI関連発明の出願戦略のポイントと生成AIを巡る知財制度上の留意点 オンライン
2024/5/17 スパース推定の本質の理解と実装応用技術への展開 オンライン
2024/5/23 ベイズ統計学の基礎と演習 オンライン
2024/5/23 ベイズ統計から学ぶ統計的機械学習 オンライン
2024/5/24 マテリアルインフォマティクスの材料開発への適用と活用事例 オンライン
2024/5/27 機械学習による適応的実験計画 オンライン
2024/5/27 外観検査へのAI導入と生成AIによるトレーニングデータ不足への対応 オンライン
2024/5/28 分子シミュレーションの基礎と高分子材料の研究・開発の効率化への展開 オンライン
2024/5/31 マテリアルズインフォマティクスのためのデータ解析 オンライン
2024/5/31 ベイズ統計学の基礎と演習 オンライン
2024/6/11 分子シミュレーションの基礎と高分子材料の研究・開発の効率化への展開 オンライン