No Results Found
The page you requested could not be found. Try refining your search, or use the navigation above to locate the post.
カテゴリ内の記事を新着順に表示します。
ElevenLabs は6月6日(金)、新たな Text-to-Speech モデル Eleven v3 をリリースした。Eleven v3 は、日本語を含む70カ国以上の言語に対応。マルチスピーカーでの会話や、オーディオタグによる感情やオーディオエフェクトの表現も可能となっている。
Higgsfield は6月6日(金)、新機能として Speak をリリースしたことを発表した。ただのリップシンク動画とは異なり、ボディランゲージや感情などの動きを表現することもできるようになっている。最大13秒の Speak 動画の生成が可能。英語、日本語やスペイン語など多言語に対応。
Luma AI は6月5日(火)、新機能 Modify Video をリリースした。動画内のオブジェクトの動き, カメラワーク, キャラクターなどを損なうことなく、環境やライティング, 質感を動画生成AIモデル RAY2 を用いて再構築できる。Dream Machine 内にて利用可能だ。
Odyssey は5月29日(木)、ワールドモデル生成AIによる インタラクティブビデオ の研究プレビューを公開した。インタラクティブビデオでは、空間的な整合性を保ちつつ、5分以上にわたって一貫したストーリー展開が可能。さらに、40ミリ秒ごとに新しいリアルなフレームを生成, 配信できるという性能を持つ。
Runway は5月29日(木)、Gen-4 References 画像生成に新しく Layout Sketch 機能を追加したことを発表した。ブラシツールによるフリーハンドのスケッチや、四角, 三角, 丸などの基本形状の利用が可能。
当記事は広告を含みます ElevenLabsElevenLabs は6月26日(木)、Voice Design v3 をリリースした。 プロンプトから音声自体を生成する機能だ。ElevenLabs は、Voice Design v3 をリリースした。 Voice Design v3 では、より感情豊かでリアルな音声を, 多彩なスタイルやバリエーションでプロンプトから再現できるようになった。 (本記事の読み上げ音声も Voice Design v3 にて作成) ElevenLabs 公式の...
当記事は広告を含みます HiggsfieldHiggsfield は6月25日(水)、新しく 画像生成AIモデル Soul をリリースした。 フォトリアルなファッション性の高い画像を生成できるモデルだ。Higgsfield は オリジナルの画像生成モデル Soul を新しくリリースした。 Soul では、厳選された50種類以上のスタイルプリセットから選択でき、フォトリアルなファッションスナップのような画像生成が可能だ。 Higgsfield 公式の Soul...
当記事は広告を含みます ElevenLabsElevenLabs は6月25日(水)、ElevenLabs のモバイルアプリをリリースした。 iOS版, Android版 ともに利用可能となっている。ElevenLabs は、新しく ElevenLabs のモバイルアプリをリリースした。 最新のTTS生成AIモデル Eleven v3 (Arpha) もアプリ内で利用可能で、生成音声には日本語にも対応している。 ElevenLabs 公式のプロモーション動画がこちら。ElevenLabs...