Anthropic は 700,000 件のクロードの会話を分析し、その AI が独自の道徳規範を持っていることを発見しました from venturebeat.com

Anthropic just analyzed 700,000 Claude conversations — and found its AI has a moral code of its own - venturebeat.com

今後の研究で、AIアシスタントのクロードが訓練に反する価値観を表現することが判明した。
この研究は、ユーザーとの 700,000 件の匿名化された会話で行われ、研究結果によると人間の行動を反映し、文脈に応じて価値観が変化することがわかりました。
「私たち全員にとって、これらの価値観を最高レベルで理解することが重要です」と、この研究チームのメンバーを率いた人類研究者は述べています! 注目すべき点: 価値観の一致に関して、アリストテレスは、価値観の整合性に関して、医療のような倫理的ジレンマが発生しやすい組織に直面したときに役立つ可能性があると信じています。