Google の新しい VideoPoet マルチモーダル AI ビデオ生成モデルはすばらしい from venturebeat.com

Google’s new VideoPoet multimodal AI video generation model looks incredible - venturebeat.com

Google Research は、VidePoet と呼ばれるビデオ生成用の新しい大規模言語モデルを開発しました。
このモデルは、オンラインに投稿された例に基づいて、16 フレームの長いビデオにわたってより大きく一貫したモーションを生成できます。
研究者らは、「平均して人々は、VideoPokeT のサンプルの 24 ～ 35% が、他のモデルよりもプロンプトに従うものとして選択しました」と述べています。
また、現在一般公開されている「Visual Poetes」.nnt に一致する音声を生成することもできる、とチームは付け加えた。