Googleの新しいマルチモーダルAIビデオジェネレーターVideoPoetは、信じられないほど素晴らしいです。

VentureBeat 2023/12/21 08:34:48(JST)

Googleは、最新の研究で、ビデオ生成タスクに使用するための新しい大規模言語モデル「VideoPoet」を発表しました。これは、テキストと画像の組み合わせからビデオを生成するために訓練されたAIモデルであり、従来の拡散ベースのモデルよりも長く、高品質なクリップを生成することができます。また、異なるカメラの動きや視覚的なスタイルのシミュレーション、新しい音声の生成など、幅広い機能を備えています。このモデルは、競合モデルと比較しても優れた結果を示し、ビデオ生成のためのオールインワンのソリューションとして評価されています。しかし、現時点では一般の利用者には利用できないため、公開時期については不明です。


Google Researchは、VideoPoetの機能をさらに拡張し、テキストから音声、音声からビデオなど、さまざまな生成タスクに対応することを計画しています。これにより、ビデオと音声の生成の可能性をさらに広げることができます。ただし、現時点では一般の利用者には利用できないため、公開時期については不明です。


VideoPoetは、縦向きのビデオを生成することに特化しており、モバイルビデオ市場に対応しています。Google Researchは、VideoPoetの登場を待ち望んでおり、他の市場でのツールとの比較をするために公開されることを期待しています。

(※本記事はAIによって自動的に要約されています。正確な情報は引用元の記事をご覧ください。)
(※画像はAIによって自動で生成されており、引用元とは関係ありません。)
引用元の記事:Google’s new multimodal AI video generator VideoPoet looks incredible.