OpenAIのデータパートナーシップ

OpenAI 2023/11/9 17:00:00(JST)

OpenAIは、AIモデルのトレーニングに使用するための公開および非公開のデータセットを作成するために、組織と協力するOpenAIデータパートナーシップを導入しています。AI技術は、トレーニングデータを理解することで、私たちの世界のスキルや側面、人々の動機、相互作用、コミュニケーション方法などを学びます。私たちは、全ての人類に安全で有益なAGIを実現するために、AIモデルがあらゆる主題、産業、文化、言語を深く理解することを望んでおり、できるだけ広範なトレーニングデータセットが必要です。あなたのコンテンツを含めることで、AIモデルはあなたのドメインの理解を深めることで、より役立つ存在になることができます。”

“私たちは、既に多くのパートナーと協力しており、彼らの国や産業のデータをAIモデルに組み込むことで、例えばアイスランド政府やMiðeind ehfとのパートナーシップを通じて、GPT-4のアイスランド語対応能力を向上させています。また、法的理解へのアクセスを民主化することを目指す非営利団体であるFree Law Projectともパートナーシップを結び、彼らの大規模な法的文書コレクションをAIのトレーニングに活用しています。AI研究の未来に貢献しながら、独自のデータの可能性を発見したいと考える多くの人々が存在することを知っています。”

“データパートナーシップは、AIの将来を導くためにより多くの組織が参加し、彼らにとってより有用なモデルを利用することを可能にすることを目的としています。私たちは、人間社会を反映し、一般の人々には容易にアクセスできない大規模なデータセットに興味を持っています。テキスト、画像、音声、ビデオなど、どのような形式のデータでも取り扱うことができます。特に、人間の意図を表現するデータ(例:断片ではなく長文や会話)を、どの言語、トピック、形式でも求めています。データのクリーニングが必要な場合(例:自動生成されたアーティファクトや転写エラーが多い場合)、最も有用な形式に加工するためにチームと協力することができます。ただし、個人情報や第三者の情報を含むデータセットは求めていません。必要な場合は、その情報を削除するために協力することもできます。”

(※本記事はAIによって自動的に要約されています。正確な情報は引用元の記事をご覧ください。)
(※画像はAIによって自動で生成されており、引用元とは関係ありません。)
引用元の記事:OpenAI Data Partnerships.