Nvidia が音声 AI レースに参入し、Meta と Google に加わる from venturebeat.com


最近、両社は、異なる言語を話す人々の間のコミュニケーションを支援する音声 AI モデルをリリースしました。
Google の音声読み上げ AI 翻訳モデルである Translation Hub は、大量のドキュメントをさまざまな言語に翻訳できます。
同時に、Meta AI のユニバーサル スピーチ トランスレータ (UST) プロジェクトは、話されているが一般的に書かれていない言語であっても、すべての言語でリアルタイムの音声から音声への翻訳を可能にする AI システムの作成を支援します。
Nvidia によると、音声 AI の言語的包含には、AI モデルが話者の多様性やノイズ プロファイルのスペクトルを理解するのに役立つなど、包括的なデータの健康上の利点があります。
Mozilla Common Voice プラットフォームは現在、100 の言語をサポートしており、世界中の 500,000 人の貢献者から 24,000 時間の音声データを利用できます。
Nvidia の現在の音声 AI 実装

コメント

タイトルとURLをコピーしました