認識率が大幅向上、エラー改善率最大20%を記録。ディープラーニングの発展技術「LSTM」を実装し、音声認識エンジンAmiVoice(R)が更に精度向上しました

11月15日(水)12時1分 PR TIMES

株式会社アドバンスト・メディア(本社:東京都豊島区、代表取締役会長兼社長:鈴木清幸 以下、アドバンスト・メディア)は、ディープラーニングの発展技術であるリカレントニューラルネットワークの「LSTM(Long Short-Term Memory)」を音声認識エンジンAmiVoiceに実装しました。これにより、エラー改善率最大20%を記録(当社調べ)し、自然発話の認識率が大きく向上いたしました。

LSTMは、リカレントニューラルネットワーク技術の一つで、これまで短期でしか利用できなかった情報を長期に渡って活用することができるという特徴を持っています。これを音声認識エンジンに実装することで認識率を向上させることが可能となりました。

この度、音声認識エンジンAmiVoiceの音響モデル、発話区間検出にLSTM技術を実装しました。過去の情報を加味しながら処理を行うことで、特に話し言葉を中心とした自然発話の認識率が大きく向上し、従来型のDNN技術と比較しエラー改善率最大20%を記録しました。加えて、精度への影響を抑えつつフレームレート(認識処理の単位)を小さくする手法を導入することで、従来のLSTM技術で課題となっていた処理速度の問題を解決し、高い認識速度を保ちながら精度向上を実現しました。発話区間検出にもLSTM技術を実装したため、発話の区間判断の精度と耐雑音性能が向上しました。
[画像: https://prtimes.jp/i/20223/55/resize/d20223-55-814227-0.jpg ]

まずは自然発話が中心となる、議事録やコールセンター分野から導入をスタートし、順次各サービスへの実装する予定です。

アドバンスト・メディアでは、今後も継続的に技術開発を進め、お客様の業務の効率化・価値創造に貢献するソリューションやサービスの提供に努めてまいります。

以上

PR TIMES

この記事が気に入ったらいいね!しよう

エンジンをもっと詳しく

BIGLOBE
トップへ