技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

コンピュータによる音声の認識

コンピュータによる音声の認識

~音声認識の基礎から、Kaldiによる大語彙音声認識システムの構築まで~
東京都 開催 会場 開催

開催日

  • 2017年2月21日(火) 11時00分16時00分

プログラム

 本セミナーでは、音声認識がどのような仕組みで実現されているのか、基本的な原理から実用的なシステムの構成までを体系的に説明します。
 さらに、国際的な研究者コミュニティにより活発な開発が進められている音声認識ツールキットKaldiと、それを用いた大語彙日本語音声認識システムについて紹介します。

  1. 音声認識の基本原理
    1. 音声コミュニケーションの仕組み
    2. 音声の分析と音響特徴量
    3. 統計的音声認識の枠組み
    4. 確率分布とベイジアンネット
  2. 音声のモデル化
    1. 音響モデル
      • 隠れマルコフモデル (HMM)
    2. 言語モデル
      • 単語ネットワーク
      • N-gram
    3. ニューラルネットを用いた音響モデル・言語モデル
  3. 音声認識器の構築
    1. 重みつき有限状態トランスデューサ (WFST)
    2. WFSTによる単語ネットワーク、N-gram、HMMの表現
    3. 合成演算による認識器の構築
    4. 探索
  4. 音声モデルの学習
    1. 最尤推定
    2. 最大事後確率推定
    3. ベイズ法
    4. ノンパラベイズと教師なし学習
  5. Kaldiツールキット
    1. ツールキットの入手とインストール
    2. 音声コーパス
    3. CSJレシピと大語彙日本語音声認識
  6. まとめと将来展望
    1. まとめ
    2. 音声研究の展望

講師

  • 篠崎 隆宏
    東京工業大学 大学院 総合理工学研究科 物理情報システム専攻
    准教授

会場

株式会社オーム社 オームセミナー室
東京都 千代田区 神田錦町3-1
株式会社オーム社 オームセミナー室の地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 46,000円 (税別) / 49,680円 (税込)
1口
: 57,000円 (税別) / 61,560円 (税込) (3名まで受講可)
本セミナーは終了いたしました。