Googleは、開発者向けにGoogle AI Studio 及びGemini API 有料プランユーザー向けに動画生成AIモデル Veo 2の提供を開始した。
Veo 2は、Google DeepMindが開発した、最先端のテキスト, 画像から動画を生成するAIモデルだ。
Google AI Studio はGoogleアカウントがあれば誰でも無料で利用可能となっている。
現時点でGoogle AI Studioにて利用できるVeo2は、テキストから動画, 画像から動画の2種類の生成方法が使え、仕様はこちら。
動画時間 : 5〜8秒
アスペクト比 : 9:16, 16:9
解像度 : 720p (1280x720px, 720x1280px)
フレームレート : 24fps
最大同時生成数 : 2
ネガティブプロンプトを入力する欄も設けられている。
プロンプトは日本語でも入力可能だ。
画像から動画での生成を試したい場合、画像はGoogleの画像生成AI Imagenなどを利用して用意すると良いだろう。
プロンプトを細かく指定することで Veo 2では上記のような高品質な動画が生成できるようだ。
Google AI StudioのVeo2での動画生成は、24時間での生成数上限が設けられているので計画的に利用しよう。
詳細情報
Google AI Studio は、Gemini などGoogleの生成系AIモデルを使ってプロンプト開発やAIアプリの試作ができる開発環境だ。
プロンプトは日本語でも入力可能なので、興味のある方は試しに使ってみることをおすすめする。

Google AI Studio 公式ページはこちら
生成AI 関連記事

Runway が AMC Networks とのパートナーシップを締結
当記事は広告を含みます RunwayRunway は6月4日(水)、 アメリカの AMC Networks とのパートナーシップ提携を発表した。 世界的にも有名な作品を輩出しているエンターテインメント会社だ。Runwayは、アメリカの国際的エンターテインメント会社 AMC Networks とのパートナーシップ提携を発表した。 AMC Networks のマーケティングおよびテレビ番組の開発プロセスに Runway のAIモデルとツールを導入するとしている。 RunwayAMC...

ElevenLabs が Eleven v3 を発表 マルチスピーカー対応で感情も表現
当記事は広告を含みます ElevenLabsElevenLabs は6月6日(金)、新たな Text-to-Speech モデル Eleven v3 をリリースした。 マルチスピーカー対応で、感情の表現が可能なモデルとなっている。ElevenLabs は、新しい Text-to-Speech (TTS)生成AIモデル Eleven v3 (Arpha) をリリースした。 Eleven v3...

Higgsfield Speak をリリース 最大13秒 アバターが喋る
当記事は広告を含みます HiggsfieldHiggsfield は6月6日(金)、新機能として Speak をリリースしたことを発表した。 好きなキャラクターを好きな言語で喋らせることができる。Higgsfield は、Speak を新機能としてリリースした。 Speak は、アバターを喋らせることのできる動画生成機能だ。 ただのリップシンク動画とは異なり、ボディランゲージや感情などの動きを表現することもできるようになっている。 Higgsfield 公式の Speak...
この記事をシェア
あわせて読みたい

Runway が AMC Networks とのパートナーシップを締結
Runway は6月4日(水)、 アメリカの AMC Networks とのパートナーシップ提携を発表した。AMC Networks のマーケティングおよびテレビ番組の開発プロセスに Runway のAIモデルとツールを導入するとしている。

ElevenLabs が Eleven v3 を発表 マルチスピーカー対応で感情も表現
ElevenLabs は6月6日(金)、新たな Text-to-Speech モデル Eleven v3 をリリースした。Eleven v3 は、日本語を含む70カ国以上の言語に対応。マルチスピーカーでの会話や、オーディオタグによる感情やオーディオエフェクトの表現も可能となっている。

Higgsfield Speak をリリース 最大13秒 アバターが喋る
Higgsfield は6月6日(金)、新機能として Speak をリリースしたことを発表した。ただのリップシンク動画とは異なり、ボディランゲージや感情などの動きを表現することもできるようになっている。最大13秒の Speak 動画の生成が可能。英語、日本語やスペイン語など多言語に対応。

Luma AI が Modify Video をリリース RAY2 を用いた動画編集機能
Luma AI は6月5日(火)、新機能 Modify Video をリリースした。動画内のオブジェクトの動き, カメラワーク, キャラクターなどを損なうことなく、環境やライティング, 質感を動画生成AIモデル RAY2 を用いて再構築できる。Dream Machine 内にて利用可能だ。

Odyssey が生成AIによる インタラクティブビデオ の研究プレビューを公開
Odyssey は5月29日(木)、ワールドモデル生成AIによる インタラクティブビデオ の研究プレビューを公開した。インタラクティブビデオでは、空間的な整合性を保ちつつ、5分以上にわたって一貫したストーリー展開が可能。さらに、40ミリ秒ごとに新しいリアルなフレームを生成, 配信できるという性能を持つ。

Runway Gen-4 References に Layout Sketch を追加
Runway は5月29日(木)、Gen-4 References 画像生成に新しく Layout Sketch 機能を追加したことを発表した。ブラシツールによるフリーハンドのスケッチや、四角, 三角, 丸などの基本形状の利用が可能。

画像生成AIモデル FLUX.1 Kontext を Black Forest Labs がリリース
Black Forest Labs は5月30日(金)、新しい画像生成AIモデルスイート FLUX.1 Kontext をリリースした。FLUX.1 Kontext は、優れたプロンプトの再現性やテキストのレンダリング性能、フォトリアルな描写力を備え、一貫した画像の生成や、画像内の局所的な編集、スタイルの参照が行える。

Veo 3, Flow が日本でもリリース Google AI Pro, Ultraプランにて利用可能に
Google は5月25日(日)、動画生成AIモデル Veo 3, 映像編集ツール Flow の対応国を71ヵ国追加し日本でも利用可能となった。Veo 3 及び Flow は、GoogleのAI用プラン Google AI Pro または Google AI Ultra を利用することで機能にアクセスできるようになる。
design-offset.com
新着記事
Runway が AMC Networks とのパートナーシップを締結
当記事は広告を含みます RunwayRunway は6月4日(水)、 アメリカの AMC Networks とのパートナーシップ提携を発表した。 世界的にも有名な作品を輩出しているエンターテインメント会社だ。Runwayは、アメリカの国際的エンターテインメント会社 AMC Networks とのパートナーシップ提携を発表した。 AMC Networks のマーケティングおよびテレビ番組の開発プロセスに Runway のAIモデルとツールを導入するとしている。 RunwayAMC...
Adobe Firefly ボードで Google Veo 3 が利用可能に
当記事は広告を含みます FireflyAdobeは6月7日(土)、Firefly ボードで利用できる動画生成AIモデルに Veo 3 を新たに追加した。 前モデルの Veo 2 も引き続き利用可能だ。Adobe は Firefly ボードで利用できる動画生成AIモデルに、新しく Veo 3 を追加した。 Veo 3 は 5月21日に発表された Google の最新動画生成AIモデルだ。Veo 3 は、高品質な映像の生成に加え、映像に合わせた音声や効果音などを同時に生成できるモデルだ。...
ElevenLabs が Eleven v3 を発表 マルチスピーカー対応で感情も表現
当記事は広告を含みます ElevenLabsElevenLabs は6月6日(金)、新たな Text-to-Speech モデル Eleven v3 をリリースした。 マルチスピーカー対応で、感情の表現が可能なモデルとなっている。ElevenLabs は、新しい Text-to-Speech (TTS)生成AIモデル Eleven v3 (Arpha) をリリースした。 Eleven v3...