CPUで動く!製薬分野に特化した音声認識モデル PHASRを開発

2024年5月13日(月)17時46分 PR TIMES

製薬業界における高性能な音声認識モデル PHASRの開発

製薬業界における高性能な音声認識モデル PHASRの開発に成功しました。
我々は、業界のニーズに合わせて設計された独自の製薬ドメイン音声データセット約10時間分を収集し、これを基にESPnetの音声認識レシピを用いて、製薬分野に特化した音声認識モデルを構築しました。

製薬ドメインにおいて、本モデルとCPUで動く一般的な音声認識モデル(Whisper medium、small、base、tiny)との比較実験を行いました。

テストには、製薬関連の30発話を用い、文字誤り率(CER)を評価指標としました。これにより、実際の製薬業務での利用において、各モデルの性能を客観的に評価しました。

テスト発話の一部を見ると、例えば以下のような内容が含まれています。
ブドウ吸菌を殺す何らかの物質を生み出している

パーキンソン病、白血病などに有効な治療法

このタンパク質っていうのはペプチドからできています


[画像1: https://prtimes.jp/i/121022/33/resize/d121022-33-86c3a63a1ebabe93db04-2.png ]

[画像2: https://prtimes.jp/i/121022/33/resize/d121022-33-b7aa273578d7b702d616-2.png ]

比較の結果、製薬ドメインにおいて、我々のモデルは他のWhisperモデルと比較しても優れた性能を示しました。特に、我々のモデルはサイズがわずか118MBという小規模ながら高品質なモデルであり、これはモデルの効率性と実用性を示す重要なポイントです。

さらに、このモデルの応用範囲は広く、製薬業界における音声認識技術の革新を促進する可能性があります。例えば、医療関係者の書類作成の効率化や、製造プロセスの監視と制御、さらには臨床試験データの分析など、様々なアプリケーションに活用できる見込みです。

デモンストレーションURL:https://huggingface.co/spaces/elith/PHASR
デモンストレーション以外の用途でご利用した場合は、弊社にお問い合わせをお願いいたします。


【株式会社Elithについて】
Elithは、AIに関わるあらゆる課題を解決するテックカンパニーです
社名:株式会社Elith
代表者:代表取締役 若林怜帆人、ファウンダー&CTO 井上顧基
本社所在地:東京都渋谷区恵比寿西2-3-13-601
事業内容:AIに関する研究、開発、設計、企画、教育、販売、保守、コンサルティング業務
会社概要 URL:https://elith.co.jp/
【本プレスリリースに関するお問い合わせ先】
株式会社Elith Eメール:contact@elith.co.jp
最先端のAI技術の教育研修、開発・導入支援、コンサルティングについてのお問い合わせも、お待ちしております。

PR TIMES

「音声」をもっと詳しく

「音声」のニュース

「音声」のニュース

トピックス

x
BIGLOBE
トップへ