当記事は広告を含みます

ElevenLabs

ElevenLabs が Eleven v3 を発表 マルチスピーカー対応で感情も表現

Publish Date on 06/06/2025

ElevenLabs は6月6日(金)、新たな Text-to-Speech モデル Eleven v3 をリリースした。

マルチスピーカー対応で、感情の表現が可能なモデルとなっている。

Categories : ElevenLabs | NEWS

ElevenLabs は、新しい Text-to-Speech (TTS)生成AIモデル Eleven v3 (Arpha) をリリースした。

Eleven v3 は、人間が喋っているかのようなテキスト読み上げが可能で、日本語を含む70カ国以上の言語に対応している。

マルチスピーカー(会話モード)の利用や、オーディオタグによる感情やサウンドエフェクトの表現も可能となっている。

ElevenLabs 公式の Eleven v3 プロモーション動画がこちら。

Eleven v3 では、サポートするオーディオタグの種類が大幅に増えた。

声に関係するタグの例

[laugh] (笑い), [whispers] (ため息), [sighs] (ため息), [excited] (興奮した) など

サウンドエフェクトタグの例

[gunshot] (銃声), [applause] (喝采), [swallows] (飲み込む)

など多種多様に用意されている。

Elevenlabs

また、Eleven v3 ではマルチスピーカーに対応し、2人以上の複数人での会話を生成することも可能だ。

話者同士が文脈や感情を共有する音声会話が作成され、自然で人間らしく聞こえるようになっている。

Elevenlabs

Eleven v3 のパブリックAPIは後日登場予定となっている。

 

6月末までは、Eleven v3 の利用コストを 80%OFF で利用できる。

興味のある方は有料プランを利用してみよう。

詳細情報

ElevenLabs は、テキストから音声, 音声からテキスト, テキストからサウンドエフェクトなど、音声関連の生成を得意とするAIプラットフォームだ。

生成する音声は日本語も対応している。

ElevenLabs 公式サイトはこちら

https://elevenlabs.io

編集記録

3/29 : AIFF作品提出締切り日を4月6日から4月13日に再延長したことを反映

Last Updated on 12/06/2025