逆強化学習の基礎、手法選択と応用

オンライン開催

開催日

2022年2月21日(月) 10時30分～ 16時30分

プログラム

第1部逆強化学習の基礎知識
1. マルコフ決定過程
  1. 平均とマルコフ性 (MP)
  2. 逐次平均表現とMP
  3. マルコフ報酬過程
  4. マルコフ決定過程
2. Bellman方程式の導出
  1. 平均から決定型Bellman方程式の導入
  2. 平均表現と価値関数の導入
  3. 確率型Bellman方程式の導出
    1. 行動状態価値関数の導入
    2. 確率型ベルマン方程式の導出
    3. 遷移確率関数 T (r ( S’) , S‘│s,a ) の極意
    4. グリッドワード問題の応用
3. 動的計画法
  1. ε = 1 – Greedy反復方策
  2. ε = 0 – Greedy方策反復法 (On – Policy)
  3. ε = 0 – Greedy価値反復法 (Off – Policy)
4. 逆強化学習の基本概念の導入
  1. 報酬関数の定義
  2. 報酬関数による価値関数の推定
第2部逆強化学習の解法:線形計画最適化逆強化学習手法
1. 線形計画最適化逆強化学習手法の導入
2. 線形計画逆強化学習手法の定式化
3. 線形計画逆強化学習手法のコーディング要領
4. 線形計画逆強化学習手法の応用事例の紹介
第3部逆強化学習の解法:最大エントロピー逆強化学習手法
1. 関数近似の基本概念
2. 関数近似モデルを用いた報酬の表現
3. 機械学習による報酬関数の回帰
4. 最大エントロピーを取り入れた報酬誤差関数の設計
5. 熟練者による行動確率教師データの生成
6. 最大エントロピー逆強化学習手法のコーディング要領
7. 最大エントロピー逆強化学習手法の応用事例の紹介
第4部逆強化学習の解法:深層NN最大エントロピー逆強化学習手法
1. 深層NN (neural network) の導入
2. 深層NN最大エントロピーを取り入れた報酬誤差関数の設計
3. 熟練者による状態頻度教師データの生成
4. 深層NN最大エントロピー逆強化学習手法のコーディング要領
5. 深層NN最大エントロピー逆強化学習手法の応用事例の紹介
第5部逆強化学習の展望と関連技術の紹介

質疑応答

ページのトップヘ

講師

曽我部東馬氏
電気通信大学 i-パワードエネルギーシステム研究センター基盤理工学専攻

教授

ページのトップヘ

主催

株式会社技術情報協会

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。

(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様

: 50,000円 (税別) / 55,000円 (税込)

複数名

: 45,000円 (税別) / 49,500円 (税込)

複数名同時受講割引について

2名様以上でお申込みの場合、1名あたり 45,000円(税別) / 49,500円(税込) で受講いただけます。
- 1名様でお申し込みの場合 : 1名で 50,000円(税別) / 55,000円(税込)
- 2名様でお申し込みの場合 : 2名で 90,000円(税別) / 99,000円(税込)
- 3名様でお申し込みの場合 : 3名で 135,000円(税別) / 148,500円(税込)
同一法人内による複数名同時申込みのみ適用いたします。
受講券、請求書は、代表者にご郵送いたします。
他の割引は併用できません。

アカデミック割引

1名様あたり 30,000円(税別) / 33,000円(税込)

日本国内に所在しており、以下に該当する方は、アカデミック割引が適用いただけます。

学校教育法にて規定された国、地方公共団体、および学校法人格を有する大学、大学院、短期大学、附属病院、高等専門学校および各種学校の教員、生徒
病院などの医療機関・医療関連機関に勤務する医療従事者
文部科学省、経済産業省が設置した独立行政法人に勤務する研究者。理化学研究所、産業技術総合研究所など
公設試験研究機関。地方公共団体に置かれる試験所、研究センター、技術センターなどの機関で、試験研究および企業支援に関する業務に従事する方

ライブ配信セミナーについて

本セミナーは「Zoom」を使ったライブ配信セミナーとなります。
お申し込み前に、視聴環境とテストミーティングへの参加手順をご確認いただき、テストミーティングにて動作確認をお願いいたします。
開催日前に、接続先URL、ミーティングID、パスワードを別途ご連絡いたします。
セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。

本セミナーは終了いたしました。

セミナーの再開催を依頼する

ページのトップヘ

開始日時		開催方法
2025/8/26	計算科学・社外実験データベースを活用したマテリアルズインフォマティクス基礎	オンライン
2025/8/27	0からのPythonと生成AIによるデータ分析入門	オンライン
2025/8/27	計算科学・社外実験データベースを活用したマテリアルズインフォマティクス基礎	オンライン
2025/8/28	マテリアルズ・インフォマティクスの基礎と実践事例	オンライン
2025/8/28	最適化技術の本命 : 進化計算法 (EC:Evolutionary Computation) の基礎と応用	オンライン
2025/8/28	ChatGPTを使ったPythonプログラミングの実践講座	オンライン
2025/8/29	マテリアルズ・インフォマティクスの基礎と実践事例	オンライン
2025/9/2	ディープラーニング手法による異常検知と製造加工業への応用展開	オンライン
2025/9/4	特許調査への生成AIの活用	オンライン
2025/9/8	ベイズ統計と機械学習の実践と応用	オンライン
2025/9/9	スパースモデリング、ベイズ最適化の基礎と少ないデータを補うための応用ポイント	オンライン
2025/9/9	ベイズ統計と機械学習の実践と応用	オンライン
2025/9/9	ベイズモデリングによる機械学習の理解と実践	オンライン
2025/9/12	要素技術者による人工知能応用開発入門	オンライン
2025/9/12	深層学習、計算機シミュレーションの基礎とシステムのモデル化技術	オンライン
2025/9/16	要素技術者による人工知能応用開発入門	オンライン
2025/9/16	自動運転・運転支援のためのミリ波レーダの基礎と車載応用、走行環境認識技術	オンライン
2025/9/16	特許調査への生成AIの活用	オンライン
2025/9/16	ケモインフォマティクスと機械学習による化学データ解析	オンライン
2025/9/17	自動運転・運転支援のためのミリ波レーダの基礎と車載応用、走行環境認識技術	オンライン

発行年月
2024/10/31	少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発
2023/6/30	生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31	機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25	AIプロセッサー
2021/10/25	AIプロセッサー (CD-ROM版)
2021/7/30	マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/7/14	AIビジネスのブレークスルーと規制強化
2021/6/30	人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28	AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11	化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31	生体情報センシングと人の状態推定への応用
2020/4/30	生体情報計測による感情の可視化技術
2020/3/26	ビッグデータ・AIの利活用に伴う法的留意点
2019/1/31	センサフュージョン技術の開発と応用事例
2018/5/31	“人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2013/6/21	機械学習によるパターン識別と画像認識への応用
1993/3/1	新しいサーボ制御の基礎と実用化技術

tech-seminar.jp

セミナー

セミナー (分野別)

出版物

お申し込み・ご購入

お問い合わせ

逆強化学習の基礎、手法選択と応用

逆強化学習の基礎、手法選択と応用

開催日

プログラム

講師

主催

お問い合わせ

受講料

複数名同時受講割引について

アカデミック割引

ライブ配信セミナーについて

ページ内で移動

これから開催される関連セミナー

関連する出版物