強化学習の基礎とその使い方

～Q学習から深層強化学習 AlphaGo Zeroまで～

東京都開催会場開催デモ付き

概要

本セミナーでは、機械学習・強化学習について基礎から解説し、学習エージェントと環境、アルゴリズム、深層強化学習について分かりやすく解説いたします。

開催日

2018年12月18日(火) 10時00分～ 17時00分

修得知識

強化学習の問題
様々な学習方法 (伝統的なQ学習から最新のAlphaGo Zeroまで)
実際の問題に対して強化学習を応用する方法

プログラム

　人工知能分野では、プロ棋士の経験に基づいて囲碁の打ち方を学習するAlphaGoが一昨年に大きな話題となり、続いてこれを上回るAlphaGo Zeroが昨年提案されました。AlphaGo Zeroは深層強化学習という最先端技術を用いることでプロ棋士の経験を全く使用せずに学習できること、また応用分野が限定されておらず、どのような分野でも適用可能であることから世界中のあらゆる分野で注目を集めております。
　本講演では、このように注目を集めて続けている強化学習を基礎から平易に解説します。学習の方法について、伝統的で幅広く用いられているQ学習から最新の深層強化学習まで、様々な学習法を紹介します。例を用い、また練習問題を解くことで理解を深めます。

強化学習の例示 (デモンストレーション)
1. 最短経路探索
2. ゲームプレイ
3. 二足歩行
強化学習問題
1. 学習エージェントと環境
2. 問題の定義
3. 設定例
表形式の強化学習法
1. 価値関数
2. 行動選択法
3. 伝統的な学習法
  - Q学習
  - Sarsa
近似を用いる強化学習法
1. 価値関数の近似
  - 放射基底関数
  - ニューラルネットワーク
2. 勾配法
3. 価値勾配を用いる学習法
4. 方策勾配を用いる学習法
人間を超える学習法:深層強化学習
1. 深層学習 (ディープラーニング)
2. ビデオゲームに対する学習法
3. 囲碁に対する学習法: AlphaGoとAlphaGoZero

質疑応答

ページのトップヘ

講師

飯間等氏
京都工芸繊維大学情報工学・人間科学系

准教授

ページのトップヘ

会場

株式会社技術情報協会

東京都品川区西五反田2-29-5 日幸五反田ビル8F

ページのトップヘ

主催

株式会社技術情報協会

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。

(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様

: 50,000円 (税別) / 54,000円 (税込)

複数名

: 45,000円 (税別) / 48,600円 (税込)

複数名同時受講割引について

2名様以上でお申込みの場合、
1名あたり 45,000円(税別) / 48,600円(税込) で受講いただけます。
- 1名様でお申し込みの場合 : 1名で 50,000円(税別) / 54,000円(税込)
- 2名様でお申し込みの場合 : 2名で 90,000円(税別) / 97,200円(税込)
- 3名様でお申し込みの場合 : 3名で 135,000円(税別) / 145,800円(税込)
同一法人内による複数名同時申込みのみ適用いたします。
受講券、請求書は、代表者にご郵送いたします。
他の割引は併用できません。

本セミナーは終了いたしました。

セミナーの再開催を依頼する

ページのトップヘ

ページ内で移動

これから開催される関連セミナー

開始日時		開催方法
2026/7/9	機械学習を用いた流体力学現象の予測とモデリング	オンライン
2026/7/13	知的センシングの要素技術と実装アプローチ	オンライン
2026/7/17	ラボオートメーションに向けた実験環境の構築と導入・実装のポイント	オンライン
2026/7/17	第一原理計算と機械学習を活用した材料設計と応用展開	オンライン
2026/7/21	第一原理計算と機械学習を活用した材料設計と応用展開	オンライン
2026/7/24	外観検査のデジタル化・自動化	オンライン
2026/7/24	多成分混合物の物性予測と機械学習の活用	オンライン
2026/7/27	外観検査のデジタル化・自動化	オンライン
2026/7/28	Pythonを用いたスペクトルデータ解析 (前編・後編)	オンライン
2026/7/28	Pythonを用いたスペクトルデータ解析 (前編)	オンライン
2026/7/28	産業現場のAI機械学習による異常検知予知の実例集	オンライン
2026/7/28	AI/生成AIによる知財業務の効率化と導入・運用のポイント	オンライン
2026/7/29	ラボオートメーションに向けた実験環境の構築と導入・実装のポイント	オンライン
2026/7/29	Pythonを用いたスペクトルデータ解析 (後編)	オンライン
2026/7/30	Pythonを用いたスペクトルデータ解析 (前編・後編)	オンライン
2026/7/30	Pythonを用いたスペクトルデータ解析 (前編)	オンライン
2026/7/30	Pythonを用いたスペクトルデータ解析 (後編)	オンライン
2026/7/30	産業現場のAI機械学習による異常検知予知の実例集	オンライン
2026/7/30	機械学習原子間ポテンシャルの理論体系と応用展開	オンライン
2026/7/31	製造現場における正常/異常判定の考え方とデータ解析結果の使いこなし方	オンライン

開始日時

会場

開催方法

2026/7/9

機械学習を用いた流体力学現象の予測とモデリング

オンライン

2026/7/13

知的センシングの要素技術と実装アプローチ

オンライン

2026/7/17

ラボオートメーションに向けた実験環境の構築と導入・実装のポイント

オンライン

2026/7/17

第一原理計算と機械学習を活用した材料設計と応用展開

オンライン

2026/7/21

第一原理計算と機械学習を活用した材料設計と応用展開

オンライン

2026/7/24

外観検査のデジタル化・自動化

オンライン

2026/7/24

多成分混合物の物性予測と機械学習の活用

オンライン

2026/7/27

外観検査のデジタル化・自動化

オンライン

2026/7/28

Pythonを用いたスペクトルデータ解析 (前編・後編)

オンライン

2026/7/28

Pythonを用いたスペクトルデータ解析 (前編)

オンライン

2026/7/28

産業現場のAI機械学習による異常検知予知の実例集

オンライン

2026/7/28

AI/生成AIによる知財業務の効率化と導入・運用のポイント

オンライン

2026/7/29

ラボオートメーションに向けた実験環境の構築と導入・実装のポイント

オンライン

2026/7/29

Pythonを用いたスペクトルデータ解析 (後編)

オンライン

2026/7/30

Pythonを用いたスペクトルデータ解析 (前編・後編)

オンライン

2026/7/30

Pythonを用いたスペクトルデータ解析 (前編)

オンライン

2026/7/30

Pythonを用いたスペクトルデータ解析 (後編)

オンライン

2026/7/30

産業現場のAI機械学習による異常検知予知の実例集

オンライン

2026/7/30

機械学習原子間ポテンシャルの理論体系と応用展開

オンライン

2026/7/31

製造現場における正常/異常判定の考え方とデータ解析結果の使いこなし方

オンライン

発行年月
2024/10/31	少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発
2023/6/30	生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31	機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25	AIプロセッサー (CD-ROM版)
2021/10/25	AIプロセッサー
2021/7/30	マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/6/30	人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28	AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11	化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31	生体情報センシングと人の状態推定への応用
2020/4/30	生体情報計測による感情の可視化技術
2019/1/31	センサフュージョン技術の開発と応用事例
2018/5/31	“人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2013/6/21	機械学習によるパターン識別と画像認識への応用
1993/3/1	新しいサーボ制御の基礎と実用化技術

tech-seminar.jp

セミナー

セミナー (分野別)

出版物

お申し込み・ご購入

お問い合わせ