ＨＭＭのプロトタイプの作成

Next: ＨＭＭモデルの学習 Up: ＨＭＭモデルの作成 Previous: ＨＭＭモデルの作成

ＨＭＭのプロトタイプの作成

学習の前には、まずＨＭＭモデルの基本構造を決定しなければならない。ここで決定するべき事項は、状態数、出力シンボルの表現方法、状態遷移の有無等である。

まず、ＨＭＭモデルの構成単位であるが、不特定話者大語彙音声認識には音素単位でＨＭＭを用いる手法が有効である[3]。そこで本研究においてもＨＭＭを音素単位で作成することとした。

音素単位で認識をする場合、１音素を１状態とすることもできるが、定常的な部分とその前後の過渡的な部分、それに初期状態と最終状態の１音素あたり５状態程度で構成されたＨＭＭモデルを作成する。また出力シンボルは離散値として表現した方が計算量の軽減は図れるが、より多くの学習データがないと完全な学習が出来ないことから、連続したベクトルとし、その確率は正規分布として表すものとする。

以上のことから、ＨＭＭモデルは音素毎に図5の様なものを作成することとした。

図 5: 各ＨＭＭモデルの基本構成