OpenAIはウェブクローリングのGPTBotを開始し、ウェブサイトのオーナーやクリエイターによるブロックの取り組みを引き起こしました。

VentureBeat 2023/8/9 05:31:43(JST)

OpenAIは、大規模な言語モデル(LLM)のトレーニングのためにウェブサイトのコンテンツをスキャンするための新しいウェブサイトクローリングボットを立ち上げました。しかし、このボットの存在が明らかになると、ウェブサイトのオーナーやクリエイターはGPTBotがデータを収集するのを防ぐ方法について情報を交換し始めました。”

“OpenAIはGPTBotのサポートページを追加すると同時に、ウェブサイトのrobots.txtファイルを修正することで、OpenAIとのデータ共有を防ぐ方法を提供しました。しかし、ウェブのスクレイピングが広範囲に行われているため、単にGPTBotをブロックするだけでは、コンテンツがLLMのトレーニングデータに含まれるのを完全に止めることはできません。”

“GPTBotの公開後、OpenAIはニューヨーク大学のジャーナリズム研究所との39.5万ドルの助成金と提携を発表しました。この提携は、元ロイター編集長のスティーブン・アドラー氏が率いるNYUの倫理とジャーナリズムイニシアチブによって行われ、AIをニュースビジネスで責任ある方法で活用するための支援を目指しています。”

(※本記事はAIによって自動的に要約されています。正確な情報は引用元の記事をご覧ください。)
(※画像はAIによって自動で生成されており、引用元とは関係ありません。)
引用元の記事:OpenAI launches web crawling GPTBot, sparking blocking effort by website owners and creators.