![](https://www.cnet.com/a/img/resize/9fabba713e328828a9481a1186cf0449d7d9b486/hub/2024/05/14/9b1ab75d-7a8a-40e7-99dd-afa76e7d4dae/screenshot-2024-05-14-at-1-42-51pm.png?auto=webp&fit=crop&height=675&width=1200)
「ジェミニ」エージェントは、ビデオ フレームを継続的にエンコードし、音声入力をイベントのタイムラインに組み合わせることで、情報をより高速に処理できるシステムを開発しました。
エージェントは、会話の中で学習して迅速に応答するようにプログラムすることもできます。
また、ユーザーがさまざまな周波数でオブジェクトを迅速に識別および識別できるアルゴリズムも開発しました。
現在、プロトタイプはまだテスト中です。
「これは信じられないほど役立つと思います」と彼は言いました。
エージェントの応答時間を示すビデオは約 15 秒です。
コメント