スタック オーバーフローは AI 巨人にトレーニング データの料金を請求します from WIRED(AI)


Reddit や Stack Overflow などのいくつかの Web サイトは、より魅力的です。
ダウンロード可能な「データ ダンプ」またはリアルタイム データ ポータルを提供して、ソフトウェアが API と呼ばれるコンテンツにアクセスできるようにします。
Stack Overflow の場合、LLM 開発者は、ダンプ、API、およびスクレイピングを組み合わせてデータを手に入れていると Chandrasekar 氏は言います。
TOS で概説されているように、ユーザーは Stack Overflow に投稿したコンテンツを所有していますが、後でデータを使用する人は誰でもそのデータの出所を言及する必要があるクリエイティブ コモンズ ライセンスに該当します。
データ アクセスについて、Chandrasekar 氏は言います。
Stack Overflow と Reddit はどちらも、引き続きデータのライセンスを一部の個人や企業に無料で提供します。

コメント

タイトルとURLをコピーしました