Next: ディジタル蝸牛モデルによる音声認識 Up: 目次 Previous: 目次

はじめに

音声認識はカーナビのような両手の使えない状況下などにおけるマシンへの入力手段として期待されている。しかし、現在の音声認識技術では人間の認識性能を上回ることが出来ていない。

これには、人間の聴覚系の中の周波数解析機能を持つ蝸牛をモデル化したディジタル蝸牛モデル[1] が有効である。これまでにディジタル蝸牛モデルの出力のパターンマッチングによる数字単語音声認識でその有効性が判明している[2]。しかし、これでは認識単語数が限られる上に新たな単語の登録も出来ず実用性に欠いていた。

そこで本研究においては、現在音声認識の分野で主流となっているＨＭＭ(Hidden Markov Model)を組み合わせることで実用的なレベルでの高い認識率の実現を図っている。