メタは静かに、一部のタスクでGPT-3.5 TurboとClaude 2を打ち負かすLlama 2 Long AIを発表しました。

VentureBeat 2023/9/30 03:00:39(JST)

Meta Platformsは、最近開催されたMeta Connectカンファレンスで、Facebook、Instagram、WhatsAppなどの消費者向けサービスに対して、さまざまな新しいAI機能を披露しました。しかし、最も注目すべきニュースは、Metaの研究者がarXiv.orgというオープンアクセスで非査読のウェブサイトに公開したコンピュータサイエンスの論文です。この論文では、MetaのオープンソースモデルであるLlama 2をベースにした新しいAIモデル「Llama 2 Long」が紹介されています。このモデルは、長いテキストに対して優れた応答を生成することができます。”

“Metaの研究者は、元のLlama 2のアーキテクチャを変更せずに、Rotary Positional Embedding(RoPE)エンコーディングに必要な修正を加えました。これにより、Llama 2 Longはより長いテキストにも対応できるようになりました。また、人間のフィードバックに基づく強化学習(RLHF)とLlama 2チャットによって生成された合成データを使用して、モデルのパフォーマンスを向上させました。”

“Llama 2 Longの論文の公開以降、RedditやTwitter、Hacker NewsなどのオープンソースAIコミュニティでは、Llama 2に対する賞賛と興奮が広がっています。これは、Metaの「オープンソース」アプローチが、資金力のあるスタートアップが提供するクローズドソースの「有料」モデルと競合することを示す大きな検証です。”

(※本記事はAIによって自動的に要約されています。正確な情報は引用元の記事をご覧ください。)
(※画像はAIによって自動で生成されており、引用元とは関係ありません。)
引用元の記事:Meta quietly unveils Llama 2 Long AI that beats GPT-3.5 Turbo and Claude 2 on some tasks.