技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

逆強化学習の基礎、手法選択と応用

逆強化学習の基礎、手法選択と応用

オンライン 開催

開催日

  • 2022年2月21日(月) 10時30分 16時30分

プログラム

  1. 第1部 逆強化学習の基礎知識
    1. マルコフ決定過程
      1. 平均とマルコフ性 (MP)
      2. 逐次平均表現とMP
      3. マルコフ報酬過程
      4. マルコフ決定過程
    2. Bellman方程式の導出
      1. 平均から決定型Bellman方程式の導入
      2. 平均表現と価値関数の導入
      3. 確率型Bellman方程式の導出
        1. 行動状態価値関数の導入
        2. 確率型ベルマン方程式の導出
        3. 遷移確率関数 T (r ( S’) , S‘│s,a ) の極意
        4. グリッドワード問題の応用
    3. 動的計画法
      1. ε = 1 – Greedy反復方策
      2. ε = 0 – Greedy方策反復法 (On – Policy)
      3. ε = 0 – Greedy価値反復法 (Off – Policy)
    4. 逆強化学習の基本概念の導入
      1. 報酬関数の定義
      2. 報酬関数による価値関数の推定
  2. 第2部 逆強化学習の解法:線形計画最適化逆強化学習手法
    1. 線形計画最適化逆強化学習手法の導入
    2. 線形計画逆強化学習手法の定式化
    3. 線形計画逆強化学習手法のコーディング要領
    4. 線形計画逆強化学習手法の応用事例の紹介
  3. 第3部 逆強化学習の解法:最大エントロピー逆強化学習手法
    1. 関数近似の基本概念
    2. 関数近似モデルを用いた報酬の表現
    3. 機械学習による報酬関数の回帰
    4. 最大エントロピーを取り入れた報酬誤差関数の設計
    5. 熟練者による行動確率教師データの生成
    6. 最大エントロピー逆強化学習手法のコーディング要領
    7. 最大エントロピー逆強化学習手法の応用事例の紹介
  4. 第4部 逆強化学習の解法:深層NN最大エントロピー逆強化学習手法
    1. 深層NN (neural network) の導入
    2. 深層NN最大エントロピーを取り入れた報酬誤差関数の設計
    3. 熟練者による状態頻度教師データの生成
    4. 深層NN最大エントロピー逆強化学習手法のコーディング要領
    5. 深層NN最大エントロピー逆強化学習手法の応用事例の紹介
  5. 第5部 逆強化学習の展望と関連技術の紹介
    • 質疑応答

講師

  • 曽我部 東馬
    電気通信大学 i-パワードエネルギーシステム研究センター 基盤理工学専攻
    准教授

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 50,000円 (税別) / 55,000円 (税込)
複数名
: 45,000円 (税別) / 49,500円 (税込)

複数名同時受講割引について

  • 2名様以上でお申込みの場合、1名あたり 45,000円(税別) / 49,500円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 50,000円(税別) / 55,000円(税込)
    • 2名様でお申し込みの場合 : 2名で 90,000円(税別) / 99,000円(税込)
    • 3名様でお申し込みの場合 : 3名で 135,000円(税別) / 148,500円(税込)
  • 同一法人内による複数名同時申込みのみ適用いたします。
  • 受講券、請求書は、代表者にご郵送いたします。
  • 他の割引は併用できません。

アカデミック割引

  • 1名様あたり 30,000円(税別) / 33,000円(税込)

日本国内に所在しており、以下に該当する方は、アカデミック割引が適用いただけます。

  • 学校教育法にて規定された国、地方公共団体、および学校法人格を有する大学、大学院、短期大学、附属病院、高等専門学校および各種学校の教員、生徒
  • 病院などの医療機関・医療関連機関に勤務する医療従事者
  • 文部科学省、経済産業省が設置した独立行政法人に勤務する研究者。理化学研究所、産業技術総合研究所など
  • 公設試験研究機関。地方公共団体に置かれる試験所、研究センター、技術センターなどの機関で、試験研究および企業支援に関する業務に従事する方

ライブ配信セミナーについて

  • 本セミナーは「Zoom」を使ったライブ配信セミナーとなります。
  • お申し込み前に、 視聴環境テストミーティングへの参加手順 をご確認いただき、 テストミーティング にて動作確認をお願いいたします。
  • 開催日前に、接続先URL、ミーティングID​、パスワードを別途ご連絡いたします。
  • セミナー開催日時に、視聴サイトにログインしていただき、ご視聴ください。
  • ご自宅への書類送付を希望の方は、通信欄にご住所・宛先などをご記入ください。
  • タブレットやスマートフォンでも受講可能ですが、機能が制限される場合があります。
  • ご視聴は、お申込み者様ご自身での視聴のみに限らせていただきます。不特定多数でご覧いただくことはご遠慮下さい。
  • 講義の録音、録画などの行為や、権利者の許可なくテキスト資料、講演データの複製、転用、販売などの二次利用することを固く禁じます。
  • Zoomのグループにパスワードを設定しています。お申込者以外の参加を防ぐため、パスワードを外部に漏洩しないでください。
    万が一、部外者が侵入した場合は管理者側で部外者の退出あるいはセミナーを終了いたします。
本セミナーは終了いたしました。

これから開催される関連セミナー

開始日時 会場 開催方法
2022/5/24 ディープニューラルネットワークモデルとMTシステムで学ぶ製造業における 「人工知能」の基礎および学習データ最小化ノウハウと「自動設計・仮想検査・未知の異常検知」への応用入門 オンライン
2022/5/26 グラフニューラルネットワーク入門 オンライン
2022/5/30 知っておきたい機械学習を用いたデータ分析の正しい進め方 オンライン
2022/6/6 インフォマティクス・機械学習活用のための多変量解析 超入門 オンライン
2022/6/9 説明可能AI (XAI:explainable AI) の作り方とAIの業務への導入方法 オンライン
2022/6/13 機械学習によるデータ分析の正しい進め方とビジネスへの適用 オンライン
2022/6/14 スパースモデリングの基礎とマテリアルズインフォマティクスによる材料開発への展開 オンライン
2022/6/14 AIを活用した革新的実験計画法の上手な活用法 オンライン
2022/6/15 時系列データ分析の基礎と実践 オンライン
2022/6/16 人工知能を使ったR&D・新規事業テーマの探索 オンライン
2022/6/17 Transformerの応用と最新技術動向 オンライン
2022/6/17 スパースモデリングの基礎とマテリアルズインフォマティクスによる材料開発への展開 オンライン
2022/6/20 統計解析・機械学習のためのPythonハンズオンセミナー オンライン
2022/6/23 深層学習による画像認識とその判断根拠の可視化 (視覚的説明) オンライン
2022/6/23 デジタル人材の育成と組織、チームの作り方 オンライン
2022/6/27 人工知能 (AI) による特許調査・分析技術と活用法 オンライン
2022/6/28 カルマンフィルタの実践 オンライン
2022/6/28 スパースモデリングの基礎と応用 オンライン
2022/6/28 機械学習を用いた画像認識技術の基礎・応用・今後の動向 オンライン
2022/6/29 グラフニューラルネットワーク (GNN) の基礎と応用 オンライン