技術セミナー・研修・出版・書籍・通信教育・eラーニング・講師派遣の テックセミナー ジェーピー

音声認識技術 入門講座

音声認識技術 入門講座

~基礎・技術課題の理解、応用事例から将来展望まで~
東京都 開催 会場 開催

概要

本セミナーでは、Deep Learningによりブレークスルーがもたらされる音声認識技術を基礎から学べます。
「より便利に」「より正確に」活用するための応用事例、最新動向を解説いたします。

開催日

  • 2017年12月8日(金) 13時00分 16時30分

受講対象者

  • 音声認識技術の応用に関連する技術者、研究者
    • 自動車内インタフェース
    • テレビ字幕制作システム
    • コールセンター
    • 音声検索
    • 音声対話システム

プログラム

 音声認識技術の基礎と、その応用である対話処理を中心に、音声言語処理について解説する。まずは基礎を知り、そのうえで応用システムなどの構築を考えていく。
 近年、深層学習に基づくパターン認識技術が急速な進展を見せているのに伴い、音声認識の性能も劇的に進化した。さらには、言語処理などの記号処理の分野にも深層学習は成果を上げており、音声言語というパターンと記号を融合した分野でも進展している。それらの最新技術についても触れる。

  1. 音声生成のメカニズム
    1. 発声器官と音声
      1. 声帯と調音器官
      2. モデルで見る発声
    2. 工学からみた発声器官 – ソース・フィルタモデル –
    3. 発声器官形状推定としての音声認識
  2. 音声認識のための信号処理
    1. 音声の取り込み
      1. 音声のサンプリング
      2. A/D変換
    2. 短時間分析
      1. 窓かけ
      2. 短時間フーリエ変換
    3. 発声器官形状情報の取り出し – スペクトル包絡の推定 –
      1. フィルタ=スペクトル包絡
      2. フィルタバンク分析
      3. メルフィルタバンク分析
    4. MFCC (Mel – Frequency Cepstral Coefficients) の導出
    5. デルタ係数の利用
  3. 隠れマルコフモデル (Hidden Markov Model; HMM) による音声認識
    1. ベクトル量子化
      1. ベクトル量子化と量子化誤差
      2. LBGアルゴリズム
      3. 音声特徴量系列のラベル系列への変換
    2. 離散分布型HMM
      1. HMMとは
      2. HMMによる音声認識
    3. 連続分布型HMM
      1. 離散分布から連続分布へ
      2. 認識アルゴリズムと学習アルゴリズム
    4. 連続音声認識
    5. WFSTによる音声認識システム
  4. 音声認識の最新動向 – Deep Neural Network (DNN) との融合 –
    1. 音声認識におけるDeep Neural Network (DNN)
      1. 特徴抽出器としてのDNN – TANDEM法 –
      2. 出力確率推定器としてのDNN – DNN – HMM法 –
    2. DNN – HMMとGMM – HMMの比較
    3. 音声認識技術の今後の動向 – End – to – end音声認識に向けて –
  5. 音声認識の応用事例 – 過去から将来まで –
    1. 自動車内インタフェース
    2. テレビ字幕制作システム
    3. CALLシステム
    4. 音声検索 – 音声ドキュメント処理 –
    5. 音声対話システム – 一問一答から知的処理まで –
  6. 音声認識・音声対話・音声言語の今後
  7. まとめ
    • 質疑応答

講師

  • 北岡 教英
    徳島大学 大学院 社会産業理工学研究部 知能情報系
    教授

会場

品川区立総合区民会館 きゅりあん

5F 第1講習室

東京都 品川区 東大井5丁目18-1
品川区立総合区民会館 きゅりあんの地図

主催

お支払い方法、キャンセルの可否は、必ずお申し込み前にご確認をお願いいたします。

お問い合わせ

本セミナーに関するお問い合わせは tech-seminar.jpのお問い合わせからお願いいたします。
(主催者への直接のお問い合わせはご遠慮くださいませ。)

受講料

1名様
: 38,000円 (税別) / 41,040円 (税込)
複数名
: 20,000円 (税別) / 21,600円 (税込)

複数名同時受講の割引特典について

  • 2名様以上でお申込みの場合、
    1名あたり 20,000円(税別) / 21,600円(税込) で受講いただけます。
    • 1名様でお申し込みの場合 : 1名で 38,000円(税別) / 41,040円(税込)
    • 2名様でお申し込みの場合 : 2名で 40,000円(税別) / 43,200円(税込)
    • 3名様でお申し込みの場合 : 3名で 60,000円(税別) / 64,800円(税込)
  • 受講者全員が会員登録をしていただいた場合に限ります。
  • 同一法人内(グループ会社でも可)による複数名同時申込みのみ適用いたします。
  • 受講券、請求書は、代表者にご郵送いたします。
  • 請求書および領収書は1名様ごとに発行可能です。
    申込みフォームの通信欄に「請求書1名ごと発行」と記入ください。
  • 他の割引は併用できません。
本セミナーは終了いたしました。

関連する出版物

発行年月
2023/6/30 生産プロセスにおけるIoT、ローカル5Gの活用
2022/12/31 機械学習・ディープラーニングによる "異常検知" 技術と活用事例集
2021/10/25 AIプロセッサー (CD-ROM版)
2021/10/25 AIプロセッサー
2021/7/30 マテリアルズインフォマティクスのためのデータ作成とその解析、応用事例
2021/7/14 AIビジネスのブレークスルーと規制強化
2021/6/30 人工知能を用いた五感・認知機能の可視化とメカニズム解明
2021/6/28 AI・MI・計算科学を活用した蓄電池研究開発動向
2020/8/11 化学・素材業界におけるデジタルトランスフォーメーションの最新調査レポート
2020/7/31 生体情報センシングと人の状態推定への応用
2020/4/30 生体情報計測による感情の可視化技術
2020/3/26 ビッグデータ・AIの利活用に伴う法的留意点
2020/3/24 リアルワールドデータの使用目的に応じた解析手法 - 各データベースの選択と組み合わせ -
2019/1/31 センサフュージョン技術の開発と応用事例
2018/5/31 “人工知能”の導入による生産性、効率性の向上、新製品開発への活用
2014/8/20 音声認識〔2014年版〕 技術開発実態分析調査報告書 (CD-ROM版)
2014/8/20 音声認識〔2014年版〕 技術開発実態分析調査報告書
2013/7/10 音声・映像コーデック 技術開発実態分析調査報告書 (CD-ROM版)
2013/7/10 音声・映像コーデック 技術開発実態分析調査報告書
2013/6/21 機械学習によるパターン識別と画像認識への応用