当記事は広告を含みます

Google

Google DeepMind が Genie 3 を発表 インタラクティブなワールドモデル

Publish Date on 08/06/2025

Google DeepMind は 8月5日(火)、新しいワールドモデル Genie 3 を発表した。

インタラクティブな汎用ワールドモデルだ。

Categories : Google | NEWS

Google DeepMind は、 ワールドモデル Genie のメジャーアップデートを発表した。

最新のモデル Genie 3 では、テキストプロンプトにより生成される 3D の世界を、ユーザーがキー入力などの操作でリアルタイムにインタラクトすることができる。

公式の YouTube 動画がこちら。

ワールドモデルとは、名前の通り世界をシミュレーションする生成AIモデルのことだ。

AGI (汎用人工知能) への重要な足掛かりとなるモデルの一つと位置付けられている。

2024年12月に発表された前モデル Genie 2 よりも、より現実に近い世界の生成が可能となり、生成される世界の一貫性の保持性能が向上している。

 

Genie 3 では、テキストプロンプトから生成される 解像度720p, フレームレート 24fps のリアルタイムに更新されるインタラクティブな世界を数分間、探索することが可能となっている。

こちらがシミュレーションの例だ。

Google DeepMind

公式では他にも様々な例が紹介されているので、気になる方はこちらから確認できる。 

世界をシミュレーションすることのできるワールドモデルは、生成AI関連のモデルを開発する各社が目標として掲げており、Odyssey, Runway なども研究を進めている。

 

Genie 3 は一般公開はされておらず、実際にユーザーが体験できるプラットフォームは提供されていない。

現在は、多くのテスターに提供する方法を模索中とのことだ。

 

ワールドモデルが気になる方は、Odyssey の公式サイトにてデモ版の世界を体験することができるので試してみてはいかがだろうか。

詳細情報

Gemini は Google が提供する、対話型生成AIアシスタントだ。

質問を投げかける以外にも、Veo 3 を用いた動画生成や、Imagen 4 を用いた画像生成にも対応している。

Google Gemini 公式ページはこちら

https://gemini.google.com/app

Last Updated on 08/06/2025

Google 関連記事

Google Gemini, Veo 3 の 画像から動画 生成機能が利用可能に

Google Gemini, Veo 3 の 画像から動画 生成機能が利用可能に

当記事は広告を含みます GeminiGoogle は 7月11日(金)、対話型生成AIアシスタント Gemini にて Veo 3 モデルの機能をアップデートしたことを発表した。 写真から動画 (image-to-video) 機能を利用できるようになった。Google Gemini にて、 Veo 3 を用いた動画生成にアップデートが入った。 動画生成AIモデル Veo 3 の、画像から動画 (image-to-video, i2v) 機能が Gemini...

Veo 3 画像から動画 で音声付き生成が可能に Google Flow にて

Veo 3 画像から動画 で音声付き生成が可能に Google Flow にて

当記事は広告を含みます GoogleGoogle は 7月1日(火)、映像制作ツール Flow のアップデートを発表した。 Veo 3 で自分で用意したキャラクター, アバターを喋らせることができるようになった。Google は、AI映像作品制作ツール Flow のアップデートを公開した。 2025年7月1日 アップデートには、Veo 3 の画像から動画 においての音声生成対応、画像から動画生成に Veo 3 - Fast モデルが対応...

Google Veo 3 動画生成AIモデルが使えるプラットフォーム 5選

Google Veo 3 動画生成AIモデルが使えるプラットフォーム 5選

当記事は広告を含みます Veo 3Google の最新動画生成AIモデル Veo 3 が利用できるプラットフォームを紹介していきます。 各社プラン料金や必要クレジット数も異なるので、併せて説明しています。CONTENTS Veo 3 について Veo 3 が使えるプラットフォーム 5選 1. Gemini, Flow 2. Adobe Firefly 3. Freepik 4. Leonardo.ai 5. fal まとめFlow...

この記事をシェア

あわせて読みたい

Runway Aleph がリリース 動画をテキストから直接編集が可能に

Runway Aleph がリリース 動画をテキストから直接編集が可能に

Runway は7月25日(金)、 新しいインコンテキスト動画モデル Runway Aleph をリリースした。動画から動画 (video-to-video, v2v) 編集を可能にするモデルで、元の動画の構成を残したまま一部分だけに変更を加えたり、全体の雰囲気をガラッと変えることもできる。

design-offset.com

新着記事

Grok Imagine が登場 画像, 音声付き動画生成機能が実装 Spicyモードも

当記事は広告を含みます xAIxAI は 8月5日(火)、Grok に新しく Grok Imagine を実装しユーザーへの展開を開始した。 AI 画像, 動画の生成ができる機能だ。xAI は 対話型生成AIアシスタント Grok に Grok Imagine を実装した。 Grok Imagine は、AI画像, 動画生成に特化した機能で、高速生成と、"ある"モードの実装で大きく話題となっている。Grok Imagine の特徴 ・高速生成 : 一般的な他の画像,...

Higgsfield が Upscale を実装 Topaz Labs によるアップスケーラー 画像, 動画に対応

当記事は広告を含みます HiggsfieldHiggsfield は 8月5日(火)、新機能 Upscale を実装した。 動画, 画像をAIにより高解像度化できる機能だ。Higgsfield は Upscale (アップスケール) 機能の追加 を発表した。 Upscale は、AI により画像, 動画を高解像度化するもので Topaz Labs による技術を採用している。 画像は最大16倍, 動画 は最大 8K までのアップスケールに対応。画像アップスケーラー...

ElevenLabs が Eleven Music をリリース テキストから音楽生成が可能に

当記事は広告を含みます ElevenLabsElevenLabs は 8月5日(火)、新しい音楽モデル Eleven Music をリリースした。 テキストから様々なジャンルの音楽を生成できる機能だ。ElevenLabs は、Eleven Music をリリースした。 Eleven Music は、自然言語によるテキストプロンプトから AI により楽曲を生成できる新しい生成モデルだ。 ElevenLabs 公式で、Eleven Music ...