Nvidia が完全にオープンソースの文字起こし AI モデル Parakeet-TDT-0.6B-V2 を Hugging Face で発表 from venturebeat.com

Nvidia が完全にオープンソースの文字起こし AI モデル Parakeet-TDT-0.6B-V2 を Hugging Face で発表 from venturebeat.com 海外記事要約

Nvidia が完全にオープンソースの文字起こし AI モデル Parakeet-TDT-0.6B-V2 を Hugging Face で発表 from venturebeat.com


このモデルは、Nvidia の GPU アクセラレーション ハードウェアを使用して、60 分の音声を 1 秒で転写できます。
このモデルは 2024 年 1 月に初めて発表され、2016 年 4 月に再度更新されました。
このモデルは開発者と研究者に公開されており、平均 WER 率は 6.65% (100 点中) でした。
これは、商業的に許可されている Creative Common Share ライセンスに基づいてリリースされています。
モデルのトレーニング データとベンチマークは、Hugging Face によるテストを含む複数の英語の ASR ベンチマーク テストにわたって評価されました。

コメント

タイトルとURLをコピーしました