強化学習入門

～基本理論と深層強化学習、ソフトコンピューティングによる展開～

東京都開催会場開催

開催日

2020年2月7日(金) 13時00分～ 17時00分

受講対象者

人工知能技術、強化学習に興味のある方
強化学習技術の応用を検討されている方

修得知識

強化学習の基本理論と基礎技術
深層学習の基本理論と基礎技術
強化学習の概念
強化学習の応用

予備知識

大学初年次程度の数学の知識
コンピュータ・コンピュータプログラムの基礎知識

プログラム

　AI (人工知能) の応用が今後益々重要な課題となってきます。そのきっかけとなったのが、深層学習の成功とAlpha GO (コンピュータ) が囲碁のプロに勝利したことです。
　本講座では、このような技術の流れを決定づけたAlpha GOでも中心的役割を担う技術として導入されている強化学習の基本理論と深層強化学習、実際の応用に繋げる上での有望な技術としてソフトコンピューティングによる展開を学んでいきます。

強化学習の理論
1. 強化学習の背景
  1. その歴史と制御技術との関係
  2. n本腕バンディッド
2. 機械学習としての強化学習
  1. 機械学習の概要
  2. 教師付学習、自己組織化、強化学習
3. エージェントモデル
  1. 環境と報酬
  2. 探索と知識利用の実現
  3. 行動モデル
  4. イプシロンGreedy
  5. ボルツマン分布の利用
  6. マルチエージェント
4. マルコフ決定過程
5. 価値関数
  1. 行動価値関数
  2. 状態価値関数
6. 報酬と部分報酬
  1. 期待報酬
7. モンテカルロ法
8. 動的計画法との関係
9. TD学習
  1. Q学習
  2. SARSA学習
  3. 適格度トレース
10. Profit Sharing
11. Policy – based method
12. Actor – Critic
深層強化学習
1. ニューラルネットワークの基礎
  1. ニューロンモデル
  2. パーセプトロン
2. 多層パーセプトロン
3. モジュラーニューラルネットワーク
4. 深層学習
5. Deep Q – Network (DQN)
6. Pythonによる実装
ソフトコンピューティングによる展開
1. 強化学習システム実装における課題
  1. 状態表現における次元の呪い
  2. 試行回数の低減
2. ファジィ理論の基礎
3. ファジィQ – 学習
4. 階層型強化学習
  1. タスクの分割
  2. 追跡問題の実装
5. ロバスト推定技術への応用
  1. コンピュータビジョンのためのモデリング
  2. 強化学習の応用

ページのトップヘ

講師

渡邊俊彦氏
大阪電気通信大学工学部電気電子工学科

教授

ページのトップヘ

会場

株式会社オーム社オームセミナー室

東京都千代田区神田錦町3-1

ページのトップヘ

主催

株式会社トリケップス

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。

(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様

: 43,000円 (税別) / 47,300円 (税込)

1口

: 56,000円 (税別) / 61,600円 (税込) (3名まで受講可)

本セミナーは終了いたしました。

セミナーの再開催を依頼する

ページのトップヘ

ページ内で移動

これから開催される関連セミナー

開始日時		開催方法
2025/4/9	マテリアルズインフォマティクス (MI) の最新動向と小規模データ駆動型MIの展開	オンライン
2025/4/10	Vision Transformerの仕組みとBEV Perception	オンライン
2025/4/11	マテリアルズインフォマティクスの基礎と高分子材料設計における応用事例	オンライン
2025/4/15	自動運転・運転支援に向けた各種センサーを用いた周辺環境認識技術	オンライン
2025/4/16	異常検知・学習データ作成のための生成AI活用	オンライン
2025/4/16	Pythonによる機械学習の基礎と実践	オンライン
2025/4/16	機械学習を用いたスペクトルデータ解析と材料開発への適用	オンライン
2025/4/17	スパース推定の基礎、本質の把握・理解と実装応用技術への展開	オンライン
2025/4/17	画像認識のためのディープラーニングとモデルの軽量化	オンライン
2025/4/22	マテリアルズインフォマティクスの高分子材料開発への応用	オンライン
2025/4/22	未知の異常も検知する人工知能MTシステム (MT法) 基礎と応用入門	オンライン
2025/4/23	ベイズ推定を用いたデータ解析	オンライン
2025/4/25	機械学習のための効率的なデータ取得法と解釈・評価方法	オンライン
2025/4/25	マテリアルズインフォマティクスの基礎と高分子材料設計における応用事例	オンライン
2025/4/28	AI外観検査 (画像認識) のはじめ方、すすめ方、精度向上への考え方	オンライン
2025/4/30	未知の異常も検知する人工知能MTシステム (MT法) 基礎と応用入門	オンライン
2025/5/6	ベイズ推定を用いたデータ解析	オンライン
2025/5/7	機械学習のための効率的なデータ取得法と解釈・評価方法	オンライン
2025/5/7	生成AIを活用したデータ分析の基礎とポイント	オンライン
2025/5/13	異常検知への生成AI活用と判断の標準化、高精度化	オンライン

開始日時

会場

開催方法

2025/4/9

マテリアルズインフォマティクス (MI) の最新動向と小規模データ駆動型MIの展開

オンライン

2025/4/10

Vision Transformerの仕組みとBEV Perception

オンライン

2025/4/11

マテリアルズインフォマティクスの基礎と高分子材料設計における応用事例

オンライン

2025/4/15

自動運転・運転支援に向けた各種センサーを用いた周辺環境認識技術

オンライン

2025/4/16

異常検知・学習データ作成のための生成AI活用

オンライン

2025/4/16

Pythonによる機械学習の基礎と実践

オンライン

2025/4/16

機械学習を用いたスペクトルデータ解析と材料開発への適用

オンライン

2025/4/17

スパース推定の基礎、本質の把握・理解と実装応用技術への展開

オンライン

2025/4/17

画像認識のためのディープラーニングとモデルの軽量化

オンライン

2025/4/22

マテリアルズインフォマティクスの高分子材料開発への応用

オンライン

2025/4/22

未知の異常も検知する人工知能MTシステム (MT法) 基礎と応用入門

オンライン

2025/4/23

ベイズ推定を用いたデータ解析

オンライン

2025/4/25

機械学習のための効率的なデータ取得法と解釈・評価方法

オンライン

2025/4/25

マテリアルズインフォマティクスの基礎と高分子材料設計における応用事例

オンライン

2025/4/28

AI外観検査 (画像認識) のはじめ方、すすめ方、精度向上への考え方

オンライン

2025/4/30

未知の異常も検知する人工知能MTシステム (MT法) 基礎と応用入門

オンライン

2025/5/6

ベイズ推定を用いたデータ解析

オンライン

2025/5/7

機械学習のための効率的なデータ取得法と解釈・評価方法

オンライン

2025/5/7

生成AIを活用したデータ分析の基礎とポイント

オンライン

2025/5/13

異常検知への生成AI活用と判断の標準化、高精度化

オンライン

発行年月
2023/6/30	生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31	機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25	AIプロセッサー (CD-ROM版)
2021/10/25	AIプロセッサー
2021/7/30	マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/7/14	AIビジネスのブレークスルーと規制強化
2021/6/30	人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28	AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11	化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31	生体情報センシングと人の状態推定への応用
2020/4/30	生体情報計測による感情の可視化技術
2020/3/26	ビッグデータ・AIの利活用に伴う法的留意点
2020/3/24	リアルワールドデータの使用目的に応じた解析手法 - 各データベースの選択と組み合わせ -
2019/1/31	センサフュージョン技術の開発と応用事例
2018/5/31	“人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2013/6/21	機械学習によるパターン識別と画像認識への応用
1993/3/1	新しいサーボ制御の基礎と実用化技術

tech-seminar.jp

セミナー

セミナー (分野別)

出版物

お申し込み・ご購入

お問い合わせ