技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

強化学習の基礎とPythonによるアルゴリズム実装

強化学習の基礎とPythonによるアルゴリズム実装

~例題やPythonを用いたプログラミング演習を通して、強化学習がうまく働く仕組みや応用例を学ぶ~
東京都 開催 会場 開催 PC実習付き

概要

本セミナーでは、簡単な例題やプログラム演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性を紹介いたします。

開催日

  • 2020年3月30日(月) 10時30分 16時30分

修得知識

  • 強化学習を用いた研究開発に必要な基礎知識
  • Python (Jupyter Notebook) を用いた強化学習アルゴリズムの実装方法
  • 強化学習モデルを利用したヒトや動物の行動解析法

プログラム

 強化学習とは環境とのインタラクションを通して試行錯誤的に最適な戦略や行動選択則を獲得する機械学習法の枠組みです。囲碁や将棋の世界では、人工知能が人間エキスパートを超えるようになり世の中を驚かせましたが、それには強化学習が大きな貢献を果たしました。では、強化学習を使えば何でもできるのでしょうか?それとも、強化学習にも苦手な応用分野はあるのでしょうか?それを知るには強化学習の基本原理を理解する必要があります。
 本講演では、簡単な例題やPythonを用いたプログラミング演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性をご紹介したいと思います。

  1. はじめに
    1. 例題から学ぶ機械学習と強化学習の位置づけ
    2. 強化学習の歴史
  2. 強化学習の基礎理論
    1. マルコフ決定過程による問題の定式化とその解法
      1. マルコフ決定過程
      2. 価値反復法
      3. 方策反復法
    2. 代表的な強化学習アルゴリズム
      1. モンテカルロ法
      2. TD学習法
      3. Q学習法
      4. SARSA法
      5. モデル同定型強化学習法
    3. アルゴリズム実装時に生じる諸問題とその解決法
      1. 探索と知識利用のジレンマ
      2. メタ学習
      3. 連続空間・高次元空間への対応とDQN
  3. プログラミング演習:Pythonによる強化学習アルゴリズムの実装
    (※各項目の合間に演習も織り交ぜます)
  4. 強化学習の応用例
    1. ロボットの自動制御
    2. 脳の意思決定モデルと行動解析
    • 質疑応答・名刺交換

講師

  • 吉本 潤一郎
    奈良先端科学技術大学院大学 先端科学技術研究科 情報科学領域
    准教授

会場

品川区立総合区民会館 きゅりあん

5F 第3講習室

東京都 品川区 東大井5丁目18-1
品川区立総合区民会館 きゅりあんの地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 42,750円 (税別) / 47,020円 (税込)
複数名
: 22,500円 (税別) / 24,750円 (税込)

複数名同時受講の割引特典について

  • 2名様以上でお申込みの場合、
    1名あたり 22,500円(税別) / 24,750円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 42,750円(税別) / 47,020円(税込)
    • 2名様でお申し込みの場合 : 2名で 45,000円(税別) / 49,500円(税込)
    • 3名様でお申し込みの場合 : 3名で 67,500円(税別) / 74,250円(税込)
  • 同一法人内 (グループ会社でも可) による複数名同時申込みのみ適用いたします。
  • 受講券、請求書は、代表者にご郵送いたします。
  • 請求書および領収書は1名様ごとに発行可能です。
    申込みフォームの通信欄に「請求書1名ごと発行」と記入ください。
  • 他の割引は併用できません。

アカデミー割引

教員、学生および医療従事者はアカデミー割引価格にて受講いただけます。

  • 1名様あたり 10,000円(税別) / 11,000円(税込)
  • 企業に属している方(出向または派遣の方も含む)は、対象外です。
  • お申込み者が大学所属名でも企業名義でお支払いの場合、対象外です。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2024/6/19 機械学習を用いた画像認識技術の基礎とその応用 オンライン
2024/6/19 外観検査自動化に向けた画像処理・AI技術活用の課題と導入のポイント オンライン
2024/6/20 ISO 13485:2016対応に必須の医療機器プロセスバリデーション (進め方、統計的手法とそのサンプルサイズ) オンライン
2024/6/24 外観検査の自動化の進め方と画像データ取得およびAIによる検査のポイント オンライン
2024/6/24 小規模データに対する機械学習の効果的適用法 オンライン
2024/6/26 少ないデータに対する機械学習の適用と学習結果の評価技術 オンライン
2024/7/1 ISO 13485:2016対応に必須の医療機器プロセスバリデーション (進め方、統計的手法とそのサンプルサイズ) オンライン
2024/7/5 小規模データに対する機械学習の効果的適用法 オンライン
2024/7/8 ディープラーニングと機械学習プロジェクトの進め方 オンライン
2024/7/9 画像認識技術を用いたAI外観検査の現場導入事例と精度向上技術 オンライン
2024/7/10 異常検知、学習データ作成への生成AI活用 オンライン
2024/7/22 画像認識技術入門 オンライン
2024/7/25 ディープニューラルネットワークモデル/MTシステムの基礎と学習データ最小化 オンライン
2024/8/5 機械学習 実践編 オンライン
2024/9/27 ファーマコメトリクス/クリニカルファーマコメトリクス オンライン