OpenAIがOperatorをo3にアップデートし、月額200ドルのChatGPT Proサブスクリプションをより魅力的なものに from venturebeat.com

OpenAI updates Operator to o3, making its $200 monthly ChatGPT Pro subscription more enticing - venturebeat.com

ChatGPT内の自律的なWebブラウジングおよびカーソル制御エージェントである「Operator」は、サードパーティのベンチマークでパフォーマンスが向上しました。
ChatGPT Proサブスクライバー（サブスクリプションのみ）向けのリサーチプレビューとして2025年1月にリリースされたこのモデルは、WebAreneで48.1から62.9のスコアを獲得しました。
報告によると、ユーザーは、指示に従うスタイルと効率性のためにこのモデルを好んでいます。
以前のモデルよりも著しく堅牢です。
また、ウォッチモードによるユーザー介入を防止しました。
国ベースのフィードバック応答は、監査ケース中に使用された場合、94%の応答率20%で見つかりました。
ウォッチモード/拒否を必要とするこのバージョンでは、脆弱性：ユーザーの参加レベルが30%大幅に減少しました。
これは、両方の手動タスクで少なくとも23%のケース特異性テストが再び観察されたためです。
観察的に* OpenAIの研究者は、82%の「無応答性[偽り]」モデルが、他の機能の中でも全体的な安全対策が100%の信頼度スコア（23%）に達すると予想しながらも、より高い精度で動作したと指摘しました。
「過活性」状態（「理解者」）に対する一般的なチェックは50%を超えましたが、それでも教師なしインタラクション機能（48%）が原因で失敗しました。
低レベルのモデル（68%）では、成功率（38%）がそれぞれ11%（平均11%）と6.9%でした。
セキュリティチームに問い合わせた無人AIエンジニアは、脆弱性のあるオープンAPIバージョンをテストしました。
これは、ゼロより0.5%低いエラーが検出されないことを意味します。