スーパーアライメントの紹介

OpenAI 2023/7/5 16:00:00(JST)

OpenAIは、スーパーインテリジェンスの調整問題を解決するために、優れた機械学習の研究者とエンジニアのチームを結成しています。スーパーインテリジェンスは、人類が開発した中で最も影響力のある技術であり、世界の重要な問題の解決に役立つ可能性がありますが、その力は非常に危険であり、人類の無力化や絶滅につながる可能性もあります。現在のAIの調整技術はスーパーインテリジェンスには対応できず、新たな科学的および技術的な突破が必要です。OpenAIは、スーパーインテリジェンスの調整研究に20%の計算リソースを割り当て、この問題を解決するための取り組みを行っています。”

“OpenAIは、自動化された調整研究者を構築することを目標としています。これには、スケーラブルなトレーニング方法の開発、モデルの検証、および調整パイプラインのストレステストが必要です。AIシステムの評価において人間が困難なタスクに対して、AIシステムを活用して評価信号を提供することができます。また、モデルが監視できないタスクに対してどのように一般化するかを理解し制御する必要があります。OpenAIは、調整の妥当性を検証するために問題行動と内部の自動化された解釈性を自動的に検索します。さらに、誤った調整モデルを意図的にトレーニングし、最悪の調整の種類を検出することで、パイプライン全体をテストすることができます。”

“OpenAIは、スーパーインテリジェンスの調整問題を解決するために、優れた機械学習の専門家を募集しています。彼らは、この問題を解決するために重要な貢献をすることができると信じています。また、OpenAIは、現在のモデルの安全性向上やAIによる他のリスクの理解と軽減にも取り組んでいます。スーパーインテリジェンスの調整は、現代の最も重要な未解決の技術問題の一つであり、この問題を解決するために世界最高の知識人が必要です。”

(※本記事はAIによって自動的に要約されています。正確な情報は引用元の記事をご覧ください。)
(※画像はAIによって自動で生成されており、引用元とは関係ありません。)
引用元の記事：Introducing Superalignment.