TechCrunch 2023/8/23 07:59:41(JST)
AIを活用した合成音声プラットフォームのElevenLabsが、30以上の言語に対応したベータ版を正式にリリースしました。ElevenLabsの新しいAIモデルを使用することで、韓国語、オランダ語、ベトナム語などの言語を自動的に識別し、感情豊かな音声を生成することが可能になりました。このモデルと組み合わせて、ElevenLabsの顧客はテキストを入力することなく、ほぼ30の言語で話すことができます。ElevenLabsのCEOで共同創設者のMati Staniszewskiは、「ElevenLabsは、すべてのコンテンツをどの言語でもどの声でも普遍的に利用できるようにするという夢を持って始まりました。このリリースにより、この夢に一歩近づき、あらゆる方言で人間の品質のAI音声を利用できるようになりました。テキストから音声への変換ツールは、すべてのクリエイターに最高品質の音声機能を提供し、公平な競争環境を実現します。」と述べています。
ElevenLabsは、AIを活用して合成音声を生成するプラットフォームとして注目を集めていますが、その一方で悪用されることもありました。有名な掲示板サイト4chanでは、ElevenLabsのツールを利用して俳優のエマ・ワトソンなどの有名人の声を模倣した憎悪のメッセージが共有されました。ElevenLabsはこれに対応するため、有料アカウントでの声のクローン化の制限や新しいAI検出ツールの導入などの新しいセキュリティ対策を講じることを発表しました。
ElevenLabsは、声優業界にも影響を与える可能性があると言われています。声優は自分の声の権利を放棄するよう求められ、AIによって合成された声が将来的に彼らの代わりになる可能性があります。ElevenLabsは、出版社やメディアプラットフォームとの協力を通じて、オーディオコンテンツの提供を行っており、将来的には感情やイントネーションを異なる言語に転送することができる基盤を構築する予定です。また、ユーザーがプラットフォーム上で声を共有できる仕組みも導入する予定です。
(※本記事はAIによって自動的に要約されています。正確な情報は引用元の記事をご覧ください。)
(※画像はAIによって自動で生成されており、引用元とは関係ありません。)
引用元の記事:ElevenLabs’ voice-generating tools launch out of beta.