技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

強化学習の基礎とPythonによるアルゴリズム実装

強化学習の基礎とPythonによるアルゴリズム実装

~例題やPythonを用いたプログラミング演習を通して、強化学習がうまく働く仕組みや応用例を学ぶ~
東京都 開催 会場 開催 PC実習付き

概要

本セミナーでは、簡単な例題やプログラム演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性を紹介いたします。

開催日

  • 2020年3月30日(月) 10時30分16時30分

修得知識

  • 強化学習を用いた研究開発に必要な基礎知識
  • Python (Jupyter Notebook) を用いた強化学習アルゴリズムの実装方法
  • 強化学習モデルを利用したヒトや動物の行動解析法

プログラム

 強化学習とは環境とのインタラクションを通して試行錯誤的に最適な戦略や行動選択則を獲得する機械学習法の枠組みです。囲碁や将棋の世界では、人工知能が人間エキスパートを超えるようになり世の中を驚かせましたが、それには強化学習が大きな貢献を果たしました。では、強化学習を使えば何でもできるのでしょうか?それとも、強化学習にも苦手な応用分野はあるのでしょうか?それを知るには強化学習の基本原理を理解する必要があります。
 本講演では、簡単な例題やPythonを用いたプログラミング演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性をご紹介したいと思います。

  1. はじめに
    1. 例題から学ぶ機械学習と強化学習の位置づけ
    2. 強化学習の歴史
  2. 強化学習の基礎理論
    1. マルコフ決定過程による問題の定式化とその解法
      1. マルコフ決定過程
      2. 価値反復法
      3. 方策反復法
    2. 代表的な強化学習アルゴリズム
      1. モンテカルロ法
      2. TD学習法
      3. Q学習法
      4. SARSA法
      5. モデル同定型強化学習法
    3. アルゴリズム実装時に生じる諸問題とその解決法
      1. 探索と知識利用のジレンマ
      2. メタ学習
      3. 連続空間・高次元空間への対応とDQN
  3. プログラミング演習:Pythonによる強化学習アルゴリズムの実装
    (※各項目の合間に演習も織り交ぜます)
  4. 強化学習の応用例
    1. ロボットの自動制御
    2. 脳の意思決定モデルと行動解析
    • 質疑応答・名刺交換

講師

会場

品川区立総合区民会館 きゅりあん

5F 第3講習室

東京都 品川区 東大井5丁目18-1
品川区立総合区民会館 きゅりあんの地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 42,750円 (税別) / 47,020円 (税込)
複数名
: 22,500円 (税別) / 24,750円 (税込)

複数名同時受講の割引特典について

  • 2名様以上でお申込みの場合、
    1名あたり 22,500円(税別) / 24,750円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 42,750円(税別) / 47,020円(税込)
    • 2名様でお申し込みの場合 : 2名で 45,000円(税別) / 49,500円(税込)
    • 3名様でお申し込みの場合 : 3名で 67,500円(税別) / 74,250円(税込)
  • 同一法人内 (グループ会社でも可) による複数名同時申込みのみ適用いたします。
  • 受講券、請求書は、代表者にご郵送いたします。
  • 請求書および領収書は1名様ごとに発行可能です。
    申込みフォームの通信欄に「請求書1名ごと発行」と記入ください。
  • 他の割引は併用できません。

アカデミー割引

教員、学生および医療従事者はアカデミー割引価格にて受講いただけます。

  • 1名様あたり 10,000円(税別) / 11,000円(税込)
  • 企業に属している方(出向または派遣の方も含む)は、対象外です。
  • お申込み者が大学所属名でも企業名義でお支払いの場合、対象外です。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2026/1/19 マテリアルズ・インフォマティクスの実践と低誘電材料開発への応用 オンライン
2026/1/19 EMCの基礎と機械学習・深層学習の応用技術 オンライン
2026/1/20 EMCの基礎と機械学習・深層学習の応用技術 オンライン
2026/1/22 生成AI・機械学習を活用した特許 (技術) 調査・分析と技術マーケティングへの応用 (2日間) オンライン
2026/1/22 生成AI・機械学習を活用した特許 (技術) 調査・分析と技術マーケティングへの応用 (基礎編) オンライン
2026/1/26 機械学習と脳科学におけるベイズ統計 オンライン
2026/1/26 外観検査 (2日間) オンライン
2026/1/26 Pythonを用いた実験計画法とその最適化 オンライン
2026/1/26 AI外観検査 (画像認識) のはじめ方、すすめ方、精度の向上 オンライン
2026/1/27 AIの選択・精度・効率・構造・コストなどの最適化原理 オンライン
2026/1/27 時系列データ分析 入門 : 基礎とExcelでの実行方法 オンライン
2026/1/28 ディジタルフィルタを理解する オンライン
2026/1/28 データ分析およびAIエージェントの基礎と活用に向けたポイント オンライン
2026/1/29 生成AI・機械学習を活用した特許 (技術) 調査・分析と技術マーケティングへの応用 (実践テクニック・応用編) オンライン
2026/1/30 AI・IoT時代の生産現場を支えるデジタル信号処理の基礎と実践応用テクニック オンライン
2026/2/2 AI・IoT時代の生産現場を支えるデジタル信号処理の基礎と実践応用テクニック オンライン
2026/2/4 AI外観検査の導入プロセスと実践ノウハウ オンライン
2026/2/5 AI外観検査の導入プロセスと実践ノウハウ オンライン
2026/2/6 データ分析およびAIエージェントの基礎と活用に向けたポイント オンライン
2026/2/12 生成AI・AIエージェントを活用した知財業務改革の実践 オンライン