強化学習の基礎とPythonによるアルゴリズム実装

～例題やPythonを用いたプログラミング演習を通して、強化学習がうまく働く仕組みや応用例を学ぶ～

東京都開催会場開催 PC実習付き

概要

本セミナーでは、簡単な例題やプログラム演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性を紹介いたします。

開催日

2020年3月30日(月) 10時30分～ 16時30分

修得知識

強化学習を用いた研究開発に必要な基礎知識
Python (Jupyter Notebook) を用いた強化学習アルゴリズムの実装方法
強化学習モデルを利用したヒトや動物の行動解析法

プログラム

　強化学習とは環境とのインタラクションを通して試行錯誤的に最適な戦略や行動選択則を獲得する機械学習法の枠組みです。囲碁や将棋の世界では、人工知能が人間エキスパートを超えるようになり世の中を驚かせましたが、それには強化学習が大きな貢献を果たしました。では、強化学習を使えば何でもできるのでしょうか?それとも、強化学習にも苦手な応用分野はあるのでしょうか?それを知るには強化学習の基本原理を理解する必要があります。
　本講演では、簡単な例題やPythonを用いたプログラミング演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性をご紹介したいと思います。

はじめに
1. 例題から学ぶ機械学習と強化学習の位置づけ
2. 強化学習の歴史
強化学習の基礎理論
1. マルコフ決定過程による問題の定式化とその解法
  1. マルコフ決定過程
  2. 価値反復法
  3. 方策反復法
2. 代表的な強化学習アルゴリズム
  1. モンテカルロ法
  2. TD学習法
  3. Q学習法
  4. SARSA法
  5. モデル同定型強化学習法
3. アルゴリズム実装時に生じる諸問題とその解決法
  1. 探索と知識利用のジレンマ
  2. メタ学習
  3. 連続空間・高次元空間への対応とDQN
プログラミング演習:Pythonによる強化学習アルゴリズムの実装
(※各項目の合間に演習も織り交ぜます)
強化学習の応用例
1. ロボットの自動制御
2. 脳の意思決定モデルと行動解析

質疑応答・名刺交換

ページのトップヘ

講師

吉本潤一郎氏
藤田医科大学医学部医学科

教授

ページのトップヘ

会場

品川区立総合区民会館きゅりあん

5F 第3講習室

東京都品川区東大井5丁目18-1

ページのトップヘ

主催

サイエンス＆テクノロジー株式会社

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。

(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様

: 42,750円 (税別) / 47,020円 (税込)

複数名

: 22,500円 (税別) / 24,750円 (税込)

複数名同時受講の割引特典について

2名様以上でお申込みの場合、
1名あたり 22,500円(税別) / 24,750円(税込) で受講いただけます。
- 1名様でお申し込みの場合 : 1名で 42,750円(税別) / 47,020円(税込)
- 2名様でお申し込みの場合 : 2名で 45,000円(税別) / 49,500円(税込)
- 3名様でお申し込みの場合 : 3名で 67,500円(税別) / 74,250円(税込)
同一法人内 (グループ会社でも可) による複数名同時申込みのみ適用いたします。
受講券、請求書は、代表者にご郵送いたします。
請求書および領収書は1名様ごとに発行可能です。
申込みフォームの通信欄に「請求書1名ごと発行」と記入ください。
他の割引は併用できません。

アカデミー割引

教員、学生および医療従事者はアカデミー割引価格にて受講いただけます。

1名様あたり 10,000円(税別) / 11,000円(税込)
企業に属している方(出向または派遣の方も含む)は、対象外です。
お申込み者が大学所属名でも企業名義でお支払いの場合、対象外です。

本セミナーは終了いたしました。

セミナーの再開催を依頼する

ページのトップヘ

ページ内で移動

これから開催される関連セミナー

開始日時		開催方法
2026/7/13	知的センシングの要素技術と実装アプローチ	オンライン
2026/7/14	はじめてのPI (プロセスインフォマティクス)	オンライン
2026/7/15	迅速化、効率化を実現する研究開発プロセスの再設計と生成AI、Python、Rの活かし方	オンライン
2026/7/17	ラボオートメーションに向けた実験環境の構築と導入・実装のポイント	オンライン
2026/7/17	知財業務における生成AI・AIエージェント活用とコーディングの進め方	オンライン
2026/7/17	第一原理計算と機械学習を活用した材料設計と応用展開	オンライン
2026/7/21	メカニスティックモデルとAIの融合による医薬品製造プロセスの開発	オンライン
2026/7/21	第一原理計算と機械学習を活用した材料設計と応用展開	オンライン
2026/7/22	生成AIを活用したデータ解析の基礎と実践	オンライン
2026/7/24	外観検査のデジタル化・自動化	オンライン
2026/7/24	はじめてのPI (プロセスインフォマティクス)	オンライン
2026/7/24	多成分混合物の物性予測と機械学習の活用	オンライン
2026/7/24	生成AIを活用したデータ解析の基礎と実践	オンライン
2026/7/27	外観検査のデジタル化・自動化	オンライン
2026/7/28	Pythonを用いたスペクトルデータ解析 (前編・後編)	オンライン
2026/7/28	Pythonを用いたスペクトルデータ解析 (前編)	オンライン
2026/7/28	産業現場のAI機械学習による異常検知予知の実例集	オンライン
2026/7/28	AI/生成AIによる知財業務の効率化と導入・運用のポイント	オンライン
2026/7/29	ラボオートメーションに向けた実験環境の構築と導入・実装のポイント	オンライン
2026/7/29	Pythonを用いたスペクトルデータ解析 (後編)	オンライン

発行年月
2024/10/31	少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発
2023/6/30	生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31	機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25	AIプロセッサー (CD-ROM版)
2021/10/25	AIプロセッサー
2021/7/30	マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/6/30	人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28	AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11	化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31	生体情報センシングと人の状態推定への応用
2020/4/30	生体情報計測による感情の可視化技術
2019/1/31	センサフュージョン技術の開発と応用事例
2018/5/31	“人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2013/6/21	機械学習によるパターン識別と画像認識への応用
1993/3/1	新しいサーボ制御の基礎と実用化技術

tech-seminar.jp

セミナー

セミナー (分野別)

出版物

お申し込み・ご購入

お問い合わせ