OpenAI gymのセミナー・研修・出版物 https://tech-seminar.jp/taxonomy/term/2156/all ja 強化学習の基礎と実践 https://tech-seminar.jp/seminar/2019-12-26-%E5%BC%B7%E5%8C%96%E5%AD%A6%E7%BF%92%E3%81%AE%E5%9F%BA%E7%A4%8E%E3%81%A8%E5%AE%9F%E8%B7%B5 <link rel="amphtml" href="https://amp.tech-seminar.jp/34126"> <div itemscope itemtype="https://schema.org/Event"> <div class="field"> <h1 itemprop="name"> 強化学習の基礎と実践</h1> </div> <div class="field field-type-text field-seminar-option"> <span class="option">東京都 開催</span> <span class="attendance_mode" itemprop="eventAttendanceMode" content="OfflineEventAttendanceMode"> 会場 開催 </span> <span class="option">PC実習付き</span> </div> <div class="clear-block"> <div class="terms"> <ul class="links inline"> <li class="term first"><a href="/taxonomy/term/982" rel="tag" title="機械学習">機械学習</a></li><li class="term"><a href="/taxonomy/term/1899" rel="tag" title="Deep Learning">Deep Learning</a></li><li class="term"><a href="/taxonomy/term/2156" rel="tag" title="OpenAI gym">OpenAI gym</a></li><li class="term"><a href="/taxonomy/term/2025" rel="tag" title="強化学習">強化学習</a></li></ul> </div> </div> <div class="clear-block"> <div class="terms"> <a href="/node/34126/similar">関連するセミナー・出版物</a> </div> </div> <div class="field"> <div>本セミナーは終了いたしました。</div><div class="contact"> <a href="/request/seminar?id=34126&date=2019-12-26&title=%E5%BC%B7%E5%8C%96%E5%AD%A6%E7%BF%92%E3%81%AE%E5%9F%BA%E7%A4%8E%E3%81%A8%E5%AE%9F%E8%B7%B5">セミナーの再開催を依頼する</a> <a href="/node/34126/similar">関連するセミナー・出版物を探す</a></div> </div> <div class="field field-type-text field-seminar-summary"> <h3 class="field-label" id="field-seminar-summary">概要</h3> <div class="field-items"><div class="field-item" itemprop="description"> <p>本セミナーでは、強化学習の基礎理論と基本アルゴリズムについて解説し、LEGOロボットを用いたデモ、最近の研究動向、最新の応用事例を紹介し、強化学習ライブラリーのOpenAI gymを用いた実習を行います。</p></div> </div> </div> <div class="field field-type-date field-seminar-start"> <h3 class="field-label" id="field-seminar-start">開催日</h3> <ul> <li> <abbr class="dtstart" title="2019-12-26T10:30:00+09:00">2019年12月26日(木) 10時30分</abbr> <meta itemprop="startDate" content="2019-12-26T10:30:00+09:00" /> ~ <abbr class="dtend" title="2019-12-26T16:30:00+09:00">16時30分</abbr> <meta itemprop="endDate" content="2019-12-26T16:30:00+09:00" /> <meta itemprop="eventStatus" content="EventScheduled" /> </li> </ul> </div> <div class="field field-type-text field-seminar-learn-knowledge"> <h3 class="field-label">修得知識</h3> <div class="field-items"> <div class="field-item"> <ul> <li>強化学習の基礎理論</li> <li>強化学習の基本アルゴリズム</li> <li>実際に強化学習を試してみることができる</li> </ul></div> </div> </div> <div class="field field-type-text field-seminar-program"> <h3 class="field-label" id="field-seminar-program">プログラム</h3> <div class="field-items"> <div class="field-item"> <p> 2016年、Googleが買収したDeepMind社が開発したコンピューター囲碁プログラムAlpha Goが囲碁の世界チャンピオンに勝利して話題となった。このAlpha Goの学習に用いられていたのが深層学習 (ディープ・ラーニング) と強化学習を組み合わせたDeep Q-Network (<span class="caps">DQN</span>) である。<br />  本セミナーでは、強化学習の基礎理論と基本アルゴリズムについて解説し、LEGOロボットを用いたデモ、最近の研究動向、最新の応用事例を紹介し、強化学習ライブラリーのOpenAI gymを用いた実習を行う。</p> <ol> <li>はじめに <ol> <li>強化学習研究の歴史</li> <li>強化学習研究の動向</li> <li>デモ (迷路)</li> </ol></li> <li>強化学習の基礎 <ol> <li>強化学習の枠組み</li> <li>マルコフ決定過程 (<span class="caps">MDP</span>s)</li> <li>決定的環境と確率的環境</li> <li>エージェントの目的</li> <li>行動価値</li> <li>学習エージェントの行動選択法 <ol> <li>一様ランダム選択</li> <li>グリーディー選択</li> <li>ε-グリーディー選択</li> <li>ソフトマックス選択</li> </ol></li> <li>探査と知識利用のジレンマ</li> </ol></li> <li>基本的な強化学習アルゴリズム <ol> <li>行動価値推定型 <ol> <li>Q学習</li> <li>Sarsa</li> </ol></li> <li>方策最適化型 <ol> <li>Policy Gradient</li> </ol></li> <li>行動価値推定型 <ol> <li>Profit Sharing (PS)</li> <li>OnPS</li> </ol></li> </ol></li> <li>強化学習パラメーターのチューニング <ol> <li>状態のチューニング</li> <li>行動のチューニング</li> <li>報酬関数のチューニング</li> <li>割引率のチューニング</li> <li>ステップあたりの時間のチューニング</li> <li>ステップサイズのチューニング</li> <li>ε-グリーディー選択におけるεのチューニング</li> <li>ソフトマックス選択における温度のチューニング</li> <li>行動価値の初期値のチューニング</li> </ol></li> <li>実環境への応用する際の課題 <ol> <li>マルチエージェント強化学習</li> <li>関数近似</li> <li>部分観測マルコフ決定過程 (<span class="caps">POMDP</span>s)</li> </ol></li> <li>最新の強化学習 <ol> <li>多目的強化学習</li> <li>逆強化学習</li> <li>安全な強化学習</li> <li>マルコフ決定過程簡約化</li> <li>複利型強化学習</li> <li>深層強化学 <ol> <li>Deep Q-Network (<span class="caps">DQN</span>)</li> <li>A3C</li> <li><span class="caps">TRPO</span></li> <li><span class="caps">PPO</span></li> </ol></li> </ol></li> <li>OpenAI gym実習 <ol> <li>OpenAIとgym</li> <li>環境構築</li> <li>サンプルプログラムの実行</li> </ol></li> <li>応用事例 <ol> <li>複利型強化学習の応用事例 <ol> <li>国債銘柄選択</li> <li>ブラックジャック</li> <li>株取引</li> <li>日本国債取引</li> </ol></li> <li>深層強化学習の応用事例 <ol> <li>ロボットアーム</li> <li>自動運転車</li> <li>ドローン</li> </ol></li> </ol></li> <li>まとめ</li> <ul> <li>質疑応答</li> </ul> </ol></div> </div> </div> <div class="topnav"> <a href="#header-region">ページのトップヘ</a> </div> <div class="field field-type-text field-seminar-place"> <h3 class="field-label" id="field-seminar-place">会場</h3> <div class="field-items"> <div class="field-item" itemprop="location" itemscope itemtype="https://schema.org/Place"> <a href="/place/%E6%B1%9F%E6%9D%B1%E5%8C%BA%E7%94%A3%E6%A5%AD%E4%BC%9A%E9%A4%A8">江東区産業会館</a> <p>第6展示室</p> <meta itemprop="name" content="江東区産業会館" /> <meta itemprop="telephone" content="03-3699-6011" /> <meta itemprop="url" content="http://www.koto-sangyokaikan.or.jp/" /> <div itemprop="address" itemscope itemtype="https://schema.org/PostalAddress"> <meta itemprop="addressCountry" content="日本" /> <meta itemprop="postalCode" content="135-0016" /> <span itemprop="addressRegion">東京都</span> <span itemprop="addressLocality">江東区</span> <span itemprop="streetAddress">東陽4丁目5-18</span> </div> <a href="/node/2363"><img class="staticmap" src="//maps.googleapis.com/maps/api/staticmap?center=東京都江東区東陽4丁目5-18&amp;markers=東京都江東区東陽4丁目5-18&amp;size=712x270&amp;zoom=16&amp;sensor=false&amp;key=AIzaSyB8IHtYT9FEZ9C5DbHmMhAfDliI9iEJQX8" alt="江東区産業会館の地図" /></a> </div> </div> </div> <div class="topnav"> <a href="#header-region">ページのトップヘ</a> </div> <div class="field"> <h3 class="field-label">主催</h3> <div class="field-items"> <div class="field-item"><a href="/company/rdsc.co.jp">株式会社 R&amp;D支援センター</a></div> <div class="field-item">お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。</div> </div> </div> <div class="field"> <h3 class="field-label">お問い合わせ</h3> <div class="field-item">本セミナーに関するお問い合わせは <a href="/contact/webadmin?id=34126&date=2019-12-26&title=%E5%BC%B7%E5%8C%96%E5%AD%A6%E7%BF%92%E3%81%AE%E5%9F%BA%E7%A4%8E%E3%81%A8%E5%AE%9F%E8%B7%B5">tech-seminar.jpのお問い合わせ</a>からお願いいたします。</div> <div class="field-item">(主催者への直接のお問い合わせはご遠慮くださいませ。)</div> </div> <div class="field field-type-number-integer field-seminar-fee"> <h3 class="field-label" id="field-seminar-fee">受講料</h3> <div class="field-items"> <div class="field-item" itemprop="offers" itemscope itemtype="https://schema.org/Offer"> <div class="field-label-inline-first">1名様</div> : <span itemprop="price" content="50000">50000円</span> (税別) / 55,000円 (税込) <meta itemprop="priceCurrency" content="JPY" /> <link itemprop="availability" href="https://schema.org/SoldOut" /> <meta itemprop="url" content="https://tech-seminar.jp/order/rdsc.co.jp/seminar?id=34126&date=2019-12-26&title=%E5%BC%B7%E5%8C%96%E5%AD%A6%E7%BF%92%E3%81%AE%E5%9F%BA%E7%A4%8E%E3%81%A8%E5%AE%9F%E8%B7%B5" /> <meta itemprop="validFrom" content="2019-10-29T17:28:25+09:00" /> </div> <div class="field-item" itemprop="offers" itemscope itemtype="https://schema.org/Offer"> <div class="field-label-inline-first">複数名</div> : <span itemprop="price" content="25000">25000円</span> (税別) / 27,500円 (税込) (案内をご希望の場合に限ります) <meta itemprop="priceCurrency" content="JPY" /> <link itemprop="availability" href="https://schema.org/SoldOut" /> <meta itemprop="url" content="https://tech-seminar.jp/order/rdsc.co.jp/seminar?id=34126&date=2019-12-26&title=%E5%BC%B7%E5%8C%96%E5%AD%A6%E7%BF%92%E3%81%AE%E5%9F%BA%E7%A4%8E%E3%81%A8%E5%AE%9F%E8%B7%B5" /> <meta itemprop="validFrom" content="2019-10-29T17:28:25+09:00" /> </div> <div itemprop="offers" itemscope itemtype="https://schema.org/AggregateOffer"> <meta itemprop="price" content="50000" /> <meta itemprop="lowPrice" content="25000" /> <meta itemprop="highPrice" content="50000" /> <meta itemprop="priceCurrency" content="JPY" /> <link itemprop="availability" href="https://schema.org/SoldOut" /> <meta itemprop="url" content="https://tech-seminar.jp/order/rdsc.co.jp/seminar?id=34126&date=2019-12-26&title=%E5%BC%B7%E5%8C%96%E5%AD%A6%E7%BF%92%E3%81%AE%E5%9F%BA%E7%A4%8E%E3%81%A8%E5%AE%9F%E8%B7%B5" /> <meta itemprop="validFrom" content="2019-10-29T17:28:25+09:00" /> </div> </div> </div> <div class="field field-type-text"> <h3>案内割引・複数名同時申込割引について</h3> <p>R&amp;D支援センターからの案内登録をご希望の方は、割引特典を受けられます。<br /> 案内および割引をご希望される方は、お申込みの際、「案内の希望 (割引適用)」の欄から案内方法をご選択ください。<br /> 複数名で同時に申込いただいた場合、1名様につき 25,000円(税別) / 27,500円(税込) で受講いただけます。</p> <ul> <li>R&amp;D支援センターからの案内を希望する方 <ul> <li>1名様でお申し込みの場合 : 1名で 45,000円(税別) / 49,500円(税込)</li> <li>2名様でお申し込みの場合 : 2名で 50,000円(税別) / 55,000円(税込)</li> <li>3名様でお申し込みの場合 : 3名で 75,000円(税別) / 82,500円(税込)</li> </ul></li> <li>R&amp;D支援センターからの案内を希望しない方 <ul> <li>1名様でお申し込みの場合 : 1名で 50,000円(税別) / 55,000円(税込)</li> <li>2名様でお申し込みの場合 : 2名で 100,000円(税別) / 110,000円(税込)</li> <li>3名様でお申し込みの場合 : 3名で 150,000円(税別) / 165,000円(税込)</li> </ul></li> </ul></div> <div class="field"> <div>本セミナーは終了いたしました。</div><div class="contact"><a href="/request/seminar?id=34126&date=2019-12-26&title=%E5%BC%B7%E5%8C%96%E5%AD%A6%E7%BF%92%E3%81%AE%E5%9F%BA%E7%A4%8E%E3%81%A8%E5%AE%9F%E8%B7%B5">セミナーの再開催を依頼する</a></div> </div> </div> <div class="topnav"> <a href="#header-region">ページのトップヘ</a> </div> <div id="nav-fixed"> <h2>ページ内で移動</h2> <ul> <li><a href="#header-region">ページのトップ</a></li> <li><a href="#field-seminar-summary">概要</a></li> <li><a href="#field-seminar-start">開催日</a></li> <li><a href="#field-seminar-program">プログラム</a></li> <li><a href="#field-seminar-lecturer">講師</a></li> <li><a href="#field-seminar-place">会場</a></li> <li><a href="#field-seminar-fee">受講料</a></li> <li><a href="/request/seminar?id=34126&date=2019-12-26&title=%E5%BC%B7%E5%8C%96%E5%AD%A6%E7%BF%92%E3%81%AE%E5%9F%BA%E7%A4%8E%E3%81%A8%E5%AE%9F%E8%B7%B5">セミナーの再開催を依頼する</a></li> <li><a href="/contact/webadmin?id=34126&date=2019-12-26&title=%E5%BC%B7%E5%8C%96%E5%AD%A6%E7%BF%92%E3%81%AE%E5%9F%BA%E7%A4%8E%E3%81%A8%E5%AE%9F%E8%B7%B5">このセミナーについて<br />問い合わせる</a></li> <li><a href="/node/34126/similar">関連セミナー・出版物</a></li> </ul> </div> 機械学習 Deep Learning OpenAI gym 強化学習 Mon, 28 Oct 2019 14:46:05 +0000 admin 34126 at https://tech-seminar.jp