新しいデータは、AI 企業が「プレミアム パブリッシャー」コンテンツを好むことを示しています from CNET(HowTo)

新しいデータは、AI 企業が「プレミアム パブリッシャー」コンテンツを好むことを示しています from CNET(HowTo) 海外記事要約

新しいデータは、AI 企業が「プレミアム パブリッシャー」コンテンツを好むことを示しています from CNET(HowTo)


AI 企業は、モデルをトレーニングするために、高品質の人間が作成したコンテンツを優先して、低品質のコンテンツを意図的に除外しました。
この調査では、トップエンドのパブリッシャーからの URL が古いモデルのトレーニング データの 12.04% (または 12.04%) を占めていることがわかりました。
特に注目すべき点は、Google、Anthropic、OpenAI はいずれも、LLM システムをトレーニングするためにプレミアム パブリッシャーのコンテンツに大きく依存しているにもかかわらず、透明性が低いことです。
パブリッシャーは著作権侵害を理由にOpenAIを訴えた。

コメント

タイトルとURLをコピーしました