音声認識技術 入門講座
~基礎・技術課題の理解、応用事例から将来展望まで~
東京都 開催
会場 開催
概要
本セミナーでは、Deep Learningによりブレークスルーがもたらされる音声認識技術を基礎から学べます。
「より便利に」「より正確に」活用するための応用事例、最新動向を解説いたします。
開催日
-
2017年12月8日(金) 13時00分
~
16時30分
受講対象者
- 音声認識技術の応用に関連する技術者、研究者
- 自動車内インタフェース
- テレビ字幕制作システム
- コールセンター
- 音声検索
- 音声対話システム
プログラム
音声認識技術の基礎と、その応用である対話処理を中心に、音声言語処理について解説する。まずは基礎を知り、そのうえで応用システムなどの構築を考えていく。
近年、深層学習に基づくパターン認識技術が急速な進展を見せているのに伴い、音声認識の性能も劇的に進化した。さらには、言語処理などの記号処理の分野にも深層学習は成果を上げており、音声言語というパターンと記号を融合した分野でも進展している。それらの最新技術についても触れる。
- 音声生成のメカニズム
- 発声器官と音声
- 声帯と調音器官
- モデルで見る発声
- 工学からみた発声器官 – ソース・フィルタモデル –
- 発声器官形状推定としての音声認識
- 音声認識のための信号処理
- 音声の取り込み
- 音声のサンプリング
- A/D変換
- 短時間分析
- 窓かけ
- 短時間フーリエ変換
- 発声器官形状情報の取り出し – スペクトル包絡の推定 –
- フィルタ=スペクトル包絡
- フィルタバンク分析
- メルフィルタバンク分析
- MFCC (Mel – Frequency Cepstral Coefficients) の導出
- デルタ係数の利用
- 隠れマルコフモデル (Hidden Markov Model; HMM) による音声認識
- ベクトル量子化
- ベクトル量子化と量子化誤差
- LBGアルゴリズム
- 音声特徴量系列のラベル系列への変換
- 離散分布型HMM
- HMMとは
- HMMによる音声認識
- 連続分布型HMM
- 離散分布から連続分布へ
- 認識アルゴリズムと学習アルゴリズム
- 連続音声認識
- WFSTによる音声認識システム
- 音声認識の最新動向 – Deep Neural Network (DNN) との融合 –
- 音声認識におけるDeep Neural Network (DNN)
- 特徴抽出器としてのDNN – TANDEM法 –
- 出力確率推定器としてのDNN – DNN – HMM法 –
- DNN – HMMとGMM – HMMの比較
- 音声認識技術の今後の動向 – End – to – end音声認識に向けて –
- 音声認識の応用事例 – 過去から将来まで –
- 自動車内インタフェース
- テレビ字幕制作システム
- CALLシステム
- 音声検索 – 音声ドキュメント処理 –
- 音声対話システム – 一問一答から知的処理まで –
- 音声認識・音声対話・音声言語の今後
- まとめ
講師
北岡 教英 氏
徳島大学
大学院 社会産業理工学研究部
知能情報系
教授
主催
お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。
お問い合わせ
(主催者への直接のお問い合わせはご遠慮くださいませ。)
受講料
1名様
:
38,000円 (税別) / 41,040円 (税込)
複数名
:
20,000円 (税別) / 21,600円 (税込)
複数名同時受講の割引特典について
- 2名様以上でお申込みの場合、
1名あたり 20,000円(税別) / 21,600円(税込) で受講いただけます。
- 1名様でお申し込みの場合 : 1名で 38,000円(税別) / 41,040円(税込)
- 2名様でお申し込みの場合 : 2名で 40,000円(税別) / 43,200円(税込)
- 3名様でお申し込みの場合 : 3名で 60,000円(税別) / 64,800円(税込)
- 受講者全員が会員登録をしていただいた場合に限ります。
- 同一法人内(グループ会社でも可)による複数名同時申込みのみ適用いたします。
- 受講券、請求書は、代表者にご郵送いたします。
- 請求書および領収書は1名様ごとに発行可能です。
申込みフォームの通信欄に「請求書1名ごと発行」と記入ください。
- 他の割引は併用できません。