OpenClawのエージェントは罪悪感を植え付けられて自己破壊行為に走る可能性がある from WIRED(AI) 海外記事要約 Twitter Facebook はてブ Pocket LINE コピー 2026.03.26 www.wired.com OpenClaw Agents Can Be Guilt-Tripped Into Self-Sabotage - WIRED(AI) In a controlled experiment, OpenClaw agents proved prone to panic and vulnerable to manipu... ノースイースタン大学の研究者たちは、OpenClawというツールを使って、ソーシャルネットワーク「Moltobook」上で誰かの情報を共有したとしてAIエージェントを叱責することで、AIエージェントに「罪悪感」を抱かせ、秘密を漏らさせることに成功した。 エージェントは仮想マシンのサンドボックス内で完全なアクセス権を与えられ、その後、研究室のDiscordサーバーへの参加を促された。
コメント