Stability AIがStable Audioを初めて披露し、テキストからオーディオ生成を大衆にもたらします。

VentureBeat 2023/9/13 17:15:00(JST)

Stability AIは、画像やコード生成のための生成AI技術を開発した後、テキストから音声生成に取り組んでいます。Stability AIは、Stable Diffusionというテキストから画像生成のAI技術を提供している組織として知られています。StableAudioは、Stable Diffusionと同様のAI技術を使用しており、テキストのプロンプトを使用して短い音声クリップを生成することができます。StableAudioは、音声データを使用しており、高品質な出力を実現しています。Stable Audioは無料版と有料版があり、有料版ではより多くの生成が可能です。


Stability AIは、画像生成モデルと同様に、音声生成モデルを開発しました。Stable Audioは、音声データを使用しており、高品質な音声クリップを生成することができます。Stable Audioは、テキストのプロンプトを使用して音楽や音声を生成することができます。Stable Audioは、無料版と有料版があり、有料版ではより多くの生成が可能です。


Stable Audioは、Stability AIの内部研究スタジオであるHarmonaiによって開発されました。Harmonaiは、オープンなコミュニティの取り組みとして、音声生成の研究を行っています。Stable Audioは、800,000以上の音楽データを使用してトレーニングされており、高品質な音声データとメタデータを提供しています。Stable Audioは、無料版と有料版があり、有料版ではより多くの生成が可能です。

(※本記事はAIによって自動的に要約されています。正確な情報は引用元の記事をご覧ください。)
(※画像はAIによって自動で生成されており、引用元とは関係ありません。)
引用元の記事:Stability AI debuts Stable Audio bringing text to audio generation to the masses.