Google DeepMind は、新しいAI動画生成モデル Veo 3 をリリースした。
Veo 3では以下のような特徴が見られる。
・テキスト, 画像から動画生成のクオリティ向上
・セリフやナレーションなどの音声追加
・音楽や効果音などのオーディオ追加
こちらがGoogle公式による、Veo 3 を用いて制作された動画だ。
プロンプト :
A medium shot, historical adventure setting: Warm lamplight illuminates a cartographer in a cluttered study, poring over an ancient, sprawling map spread across a large table. Cartographer: “According to this old sea chart, the lost island isn’t myth! We must prepare an expedition immediately!”
上記プロンプトの太字の部分が、動画内でキャラクターが喋っているセリフのプロンプトとなっている。
動きを交えながら、忠実にプロンプトの文章が違和感なく読み上げられていることが確認できる。
他にも、以下のような高品質な映像を制作できる例が紹介されている。
音声を追加できるAI動画生成モデルは、現状他社モデルでもあまり例を見ないことから、Veo 3 は大きく注目を集めそうだ。
Veo 3 は発表時点で、開発者用プラットフォーム Vertex AI にてプライベートプレビュー中で、今後数週間以内により広く提供される予定となっている。
< 追記 5月25日(日) >
Veo 3 が日本を含む 71ヵ国で利用できるようになった。
映像編集ツール Flow 及び、Gemini 内で Veo 3 を利用した動画生成ができるようになっている。
詳細情報
Google AI Ultraプラン(月額 ¥36,400)の利用で、Flow, Gemini 内で Veo 3 にアクセスできるようになる。最初の3ヶ月は半額の ¥18,000 にて利用可能だ。
Proプランでもトライアル版として Veo 3 を利用することができるようになっている。

Veo 公式ページはこちら
編集記録
5/25 : Veo 3 が日本でも提供開始
Google 関連記事

Google DeepMind が Genie 3 を発表 インタラクティブなワールドモデル
当記事は広告を含みます GoogleGoogle DeepMind は 8月5日(火)、新しいワールドモデル Genie 3 を発表した。 インタラクティブな汎用ワールドモデルだ。Google DeepMind は、 ワールドモデル Genie のメジャーアップデートを発表した。 最新のモデル Genie 3 では、テキストプロンプトにより生成される 3D の世界を、ユーザーがキー入力などの操作でリアルタイムにインタラクトすることができる。 公式の YouTube...

Google Gemini, Veo 3 の 画像から動画 生成機能が利用可能に
当記事は広告を含みます GeminiGoogle は 7月11日(金)、対話型生成AIアシスタント Gemini にて Veo 3 モデルの機能をアップデートしたことを発表した。 写真から動画 (image-to-video) 機能を利用できるようになった。Google Gemini にて、 Veo 3 を用いた動画生成にアップデートが入った。 動画生成AIモデル Veo 3 の、画像から動画 (image-to-video, i2v) 機能が Gemini...

Veo 3 画像から動画 で音声付き生成が可能に Google Flow にて
当記事は広告を含みます GoogleGoogle は 7月1日(火)、映像制作ツール Flow のアップデートを発表した。 Veo 3 で自分で用意したキャラクター, アバターを喋らせることができるようになった。Google は、AI映像作品制作ツール Flow のアップデートを公開した。 2025年7月1日 アップデートには、Veo 3 の画像から動画 においての音声生成対応、画像から動画生成に Veo 3 - Fast モデルが対応...
この記事をシェア
あわせて読みたい

MeshyAI が Meshy 5 をリリース Proプラン 50%OFFキャンペーンも
MeshyAI は8月8日(金)、 新しい 3D生成AIモデル Meshy 5 をリリースした。3月にプレビュー版として提供されていた Meshy 5 Preview からのメジャーアップデートとなっている。

Grok Imagine が登場 画像, 音声付き動画生成機能が実装 Spicyモードも
xAI は 8月5日(火)、Grok に新しく Grok Image を実装しユーザーへの展開を開始した。画像, 動画生成に対応し、高速生成や Spicy モードでの生成が大きな特徴。

Higgsfield が Upscale を実装 Topaz Labs によるアップスケーラー 画像, 動画に対応
Higgsfield は 8月5日(火)、Upscale を実装した。Upscale は、AI により画像, 動画を高解像度化するもので Topaz Labs による技術を採用している。画像は最大16倍, 動画 は最大 8K までのアップスケールに対応。

Google DeepMind が Genie 3 を発表 インタラクティブなワールドモデル
Google DeepMind は 8月5日(火)、新しいワールドモデル Genie 3 を発表した。テキストプロンプトにより生成される 3D の世界を数分間にわたり、ユーザーがキー入力などの操作でリアルタイムにインタラクトすることができる。

ElevenLabs が Eleven Music をリリース テキストから音楽生成が可能に
ElevenLabs は 8月5日(火)、新しい音楽モデル Eleven Music をリリースした。自然言語によるテキストプロンプトから AI により様々なジャンルの楽曲を生成できる新しい生成モデルだ。日本語を含む多言語での歌詞付き楽曲生成にも対応。

Ideogram Character をリリース 1枚の画像から一貫性のあるキャラクター作成
Ideogram は7月29日(火)、新機能 Ideogram Character をリリースした。人間, 動物など特定の被写体の写真1枚から、一貫性のあるキャラクターの様々なバリエーション画像を生成できるモデルとなる。

Luma AI が Modify with Instructions をリリース 自然言語で動画を編集
Luma AI は7月30日(水)、新機能 Modify with Instruction をリリースした。動画から動画 (video-to-video, v2v) 編集機能で、自然言語によるプロンプトでオブジェクトの追加, 削除、VFXの追加、シーンの変更などがより直感的にできるようになった。

Runway Aleph がリリース 動画をテキストから直接編集が可能に
Runway は7月25日(金)、 新しいインコンテキスト動画モデル Runway Aleph をリリースした。動画から動画 (video-to-video, v2v) 編集を可能にするモデルで、元の動画の構成を残したまま一部分だけに変更を加えたり、全体の雰囲気をガラッと変えることもできる。
design-offset.com
新着記事
【2025年版】Adobe Stock の 1点単品購入はできる? について解説
当記事は広告を含みます Adobe StockAdobe Stock では 1点のみの単品購入ができるのかについて説明しています。 また、購入点数が少ない方向けのおすすめプランもあわせて紹介します。CONTENTS Adobe Stock について Adobe Stock の 1点購入について 通常ライセンス素材に関して 1. クレジットパックの購入 2. 月々プランの利用 まとめAdobe Stock 公式サイトはこちら...
【2025年版】Adobe 法人, グループ版 を安く利用する方法について解説
当記事は広告を含みます AdobeAdobe のグループ版 (法人版) プランを安く利用する方法について説明していきます。 グループ版限定のオプションなどが提供されています。CONTENTS Adobe 法人, グループ版について 安く利用する方法について 1. Adobe セール 2. 年間一括払い 3. ボリュームディスカウント 4. Creative Cloud Pro Plus まとめAdobe Creative Cloud...
【2025年版】Adobe 法人, グループ版 プラン一覧と料金についてまとめ
当記事は広告を含みます AdobeAdobe のグループ版 (法人版) プラン一覧とそれぞれの料金について説明していきます。 様々なデザインツールが展開されているため、プランも様々なものが用意されています。CONTENTS Adobe 法人, グループ版について Adobe のプラン体系 1. Creative Cloud プラン 2. Firefly プラン 3. Substance 3D プラン 4. Adobe Stock プラン...