Google DeepMind は、 ワールドモデル Genie のメジャーアップデートを発表した。
最新のモデル Genie 3 では、テキストプロンプトにより生成される 3D の世界を、ユーザーがキー入力などの操作でリアルタイムにインタラクトすることができる。
公式の YouTube 動画がこちら。
ワールドモデルとは、名前の通り世界をシミュレーションする生成AIモデルのことだ。
AGI (汎用人工知能) への重要な足掛かりとなるモデルの一つと位置付けられている。
2024年12月に発表された前モデル Genie 2 よりも、より現実に近い世界の生成が可能となり、生成される世界の一貫性の保持性能が向上している。
Genie 3 では、テキストプロンプトから生成される 解像度720p, フレームレート 24fps のリアルタイムに更新されるインタラクティブな世界を数分間、探索することが可能となっている。
こちらがシミュレーションの例だ。
Google DeepMind
詳細情報
Gemini は Google が提供する、対話型生成AIアシスタントだ。
質問を投げかける以外にも、Veo 3 を用いた動画生成や、Imagen 4 を用いた画像生成にも対応している。

Google Gemini 公式ページはこちら
Google 関連記事

Google Gemini, Veo 3 の 画像から動画 生成機能が利用可能に
当記事は広告を含みます GeminiGoogle は 7月11日(金)、対話型生成AIアシスタント Gemini にて Veo 3 モデルの機能をアップデートしたことを発表した。 写真から動画 (image-to-video) 機能を利用できるようになった。Google Gemini にて、 Veo 3 を用いた動画生成にアップデートが入った。 動画生成AIモデル Veo 3 の、画像から動画 (image-to-video, i2v) 機能が Gemini...

Veo 3 画像から動画 で音声付き生成が可能に Google Flow にて
当記事は広告を含みます GoogleGoogle は 7月1日(火)、映像制作ツール Flow のアップデートを発表した。 Veo 3 で自分で用意したキャラクター, アバターを喋らせることができるようになった。Google は、AI映像作品制作ツール Flow のアップデートを公開した。 2025年7月1日 アップデートには、Veo 3 の画像から動画 においての音声生成対応、画像から動画生成に Veo 3 - Fast モデルが対応...

Google Veo 3 動画生成AIモデルが使えるプラットフォーム 5選
当記事は広告を含みます Veo 3Google の最新動画生成AIモデル Veo 3 が利用できるプラットフォームを紹介していきます。 各社プラン料金や必要クレジット数も異なるので、併せて説明しています。CONTENTS Veo 3 について Veo 3 が使えるプラットフォーム 5選 1. Gemini, Flow 2. Adobe Firefly 3. Freepik 4. Leonardo.ai 5. fal まとめFlow...
この記事をシェア
あわせて読みたい

Grok Imagine が登場 画像, 音声付き動画生成機能が実装 Spicyモードも
xAI は 8月5日(火)、Grok に新しく Grok Image を実装しユーザーへの展開を開始した。画像, 動画生成に対応し、高速生成や Spicy モードでの生成が大きな特徴。

Higgsfield が Upscale を実装 Topaz Labs によるアップスケーラー 画像, 動画に対応
Higgsfield は 8月5日(火)、Upscale を実装した。Upscale は、AI により画像, 動画を高解像度化するもので Topaz Labs による技術を採用している。画像は最大16倍, 動画 は最大 8K までのアップスケールに対応。

ElevenLabs が Eleven Music をリリース テキストから音楽生成が可能に
ElevenLabs は 8月5日(火)、新しい音楽モデル Eleven Music をリリースした。自然言語によるテキストプロンプトから AI により様々なジャンルの楽曲を生成できる新しい生成モデルだ。日本語を含む多言語での歌詞付き楽曲生成にも対応。

Ideogram Character をリリース 1枚の画像から一貫性のあるキャラクター作成
Ideogram は7月29日(火)、新機能 Ideogram Character をリリースした。人間, 動物など特定の被写体の写真1枚から、一貫性のあるキャラクターの様々なバリエーション画像を生成できるモデルとなる。

Luma AI が Modify with Instructions をリリース 自然言語で動画を編集
Luma AI は7月30日(水)、新機能 Modify with Instruction をリリースした。動画から動画 (video-to-video, v2v) 編集機能で、自然言語によるプロンプトでオブジェクトの追加, 削除、VFXの追加、シーンの変更などがより直感的にできるようになった。

Runway Aleph がリリース 動画をテキストから直接編集が可能に
Runway は7月25日(金)、 新しいインコンテキスト動画モデル Runway Aleph をリリースした。動画から動画 (video-to-video, v2v) 編集を可能にするモデルで、元の動画の構成を残したまま一部分だけに変更を加えたり、全体の雰囲気をガラッと変えることもできる。

【2025年8月】動画生成AIモデル おすすめ, トレンド 5選 をランキングで紹介
2025年 おすすめ, トレンドの動画生成AIモデルをランキング形式で5選紹介します。最新のアップデートやリリースを反映して随時更新中です。

【2025年版】無制限に AI 動画生成ができるプラットフォーム 5選
AI動画生成が無制限にできるプランのあるプラットフォームを紹介していきます。1. Runway 2. Midjourney 3. Dream Machine by Luma AI 4. Adobe Firefly 5. Sora by OpenAI
design-offset.com
新着記事
Grok Imagine が登場 画像, 音声付き動画生成機能が実装 Spicyモードも
当記事は広告を含みます xAIxAI は 8月5日(火)、Grok に新しく Grok Imagine を実装しユーザーへの展開を開始した。 AI 画像, 動画の生成ができる機能だ。xAI は 対話型生成AIアシスタント Grok に Grok Imagine を実装した。 Grok Imagine は、AI画像, 動画生成に特化した機能で、高速生成と、"ある"モードの実装で大きく話題となっている。Grok Imagine の特徴 ・高速生成 : 一般的な他の画像,...
Higgsfield が Upscale を実装 Topaz Labs によるアップスケーラー 画像, 動画に対応
当記事は広告を含みます HiggsfieldHiggsfield は 8月5日(火)、新機能 Upscale を実装した。 動画, 画像をAIにより高解像度化できる機能だ。Higgsfield は Upscale (アップスケール) 機能の追加 を発表した。 Upscale は、AI により画像, 動画を高解像度化するもので Topaz Labs による技術を採用している。 画像は最大16倍, 動画 は最大 8K までのアップスケールに対応。画像アップスケーラー...
ElevenLabs が Eleven Music をリリース テキストから音楽生成が可能に
当記事は広告を含みます ElevenLabsElevenLabs は 8月5日(火)、新しい音楽モデル Eleven Music をリリースした。 テキストから様々なジャンルの音楽を生成できる機能だ。ElevenLabs は、Eleven Music をリリースした。 Eleven Music は、自然言語によるテキストプロンプトから AI により楽曲を生成できる新しい生成モデルだ。 ElevenLabs 公式で、Eleven Music ...