Google DeepMind は、 ワールドモデル Genie のメジャーアップデートを発表した。
最新のモデル Genie 3 では、テキストプロンプトにより生成される 3D の世界を、ユーザーがキー入力などの操作でリアルタイムにインタラクトすることができる。
公式の YouTube 動画がこちら。
ワールドモデルとは、名前の通り世界をシミュレーションする生成AIモデルのことだ。
AGI (汎用人工知能) への重要な足掛かりとなるモデルの一つと位置付けられている。
2024年12月に発表された前モデル Genie 2 よりも、より現実に近い世界の生成が可能となり、生成される世界の一貫性の保持性能が向上している。
Genie 3 では、テキストプロンプトから生成される 解像度720p, フレームレート 24fps のリアルタイムに更新されるインタラクティブな世界を数分間、探索することが可能となっている。
こちらがシミュレーションの例だ。
Google DeepMind
詳細情報
Gemini は Google が提供する、対話型生成AIアシスタントだ。
質問を投げかける以外にも、Veo 3 を用いた動画生成や、Imagen 4 を用いた画像生成にも対応している。

Google Gemini 公式ページはこちら
Google 関連記事

Google Gemini 2.5 Flash Image がリリース Nano Banana で話題の高性能な画像編集モデル
当記事は広告を含みます GoogleGoogle は8月26日(火)、Gemini における画像編集モデル のメジャーアップデートを発表した。 Google の新しい画像生成,編集モデルが登場した。Gemini におけるAI画像生成, 編集モデルが大幅にアップデートされた。 Google DeepMind による、新しい高性能な画像編集モデル ( 一般的には Gemini 2.5 Flash Image Model と表記されている) が Gemini に搭載される形でリリースとなった。...

Google Gemini, Veo 3 の 画像から動画 生成機能が利用可能に
当記事は広告を含みます GeminiGoogle は 7月11日(金)、対話型生成AIアシスタント Gemini にて Veo 3 モデルの機能をアップデートしたことを発表した。 写真から動画 (image-to-video) 機能を利用できるようになった。Google Gemini にて、 Veo 3 を用いた動画生成にアップデートが入った。 動画生成AIモデル Veo 3 の、画像から動画 (image-to-video, i2v) 機能が Gemini...

Veo 3 画像から動画 で音声付き生成が可能に Google Flow にて
当記事は広告を含みます GoogleGoogle は 7月1日(火)、映像制作ツール Flow のアップデートを発表した。 Veo 3 で自分で用意したキャラクター, アバターを喋らせることができるようになった。Google は、AI映像作品制作ツール Flow のアップデートを公開した。 2025年7月1日 アップデートには、Veo 3 の画像から動画 においての音声生成対応、画像から動画生成に Veo 3 - Fast モデルが対応...
この記事をシェア
あわせて読みたい

Luma AI が Ray 3 動画生成AIモデルをリリース HDRに対応
Luma AI は9月18日(木)、新しい動画生成AIモデル RAY 3 をリリースした。世界で初めて 16bit HDR に対応し、視覚的な思考と推論ができるモデルだ。

ElevenLabs が Studio 3.0 をリリース 各機能を一元化するハブ
ElevenLabs は 9月17日(水)、新しく Studio 3.0 をリリース。各種機能が統合されており、動画, 音声編集のワークフローを1箇所で完結させることが可能。

MeshyAI が Meshy 6 Preview を公開 画像から3D生成で利用可能に
MeshyAI は 9月13日(土)、 新しい 3D生成AIモデル Meshy 6 Preview を公開した。image-to-3D (画像から3D) 生成のみで使用可能で、無料ユーザーも利用可能。

Google Gemini 2.5 Flash Image がリリース Nano Banana で話題の高性能な画像編集モデル
対話型生成AIアシスタント Google Gemini に、新しい画像生成, 編集モデル Gemini 2.5 Flash Image モデルが実装された。Nano Banana として発表前から注目を集めていたモデルだ。

MeshyAI が Meshy 5 をリリース Proプラン 50%OFFキャンペーンも
MeshyAI は8月8日(金)、 新しい 3D生成AIモデル Meshy 5 をリリースした。3月にプレビュー版として提供されていた Meshy 5 Preview からのメジャーアップデートとなっている。

Grok Imagine が登場 画像, 音声付き動画生成機能が実装 Spicyモードも
xAI は 8月5日(火)、Grok に新しく Grok Image を実装しユーザーへの展開を開始した。画像, 動画生成に対応し、高速生成や Spicy モードでの生成が大きな特徴。

Higgsfield が Upscale を実装 Topaz Labs によるアップスケーラー 画像, 動画に対応
Higgsfield は 8月5日(火)、Upscale を実装した。Upscale は、AI により画像, 動画を高解像度化するもので Topaz Labs による技術を採用している。画像は最大16倍, 動画 は最大 8K までのアップスケールに対応。

ElevenLabs が Eleven Music をリリース テキストから音楽生成が可能に
ElevenLabs は 8月5日(火)、新しい音楽モデル Eleven Music をリリースした。自然言語によるテキストプロンプトから AI により様々なジャンルの楽曲を生成できる新しい生成モデルだ。日本語を含む多言語での歌詞付き楽曲生成にも対応。
design-offset.com
新着記事
Adobe Firefly パートナーモデルに Luma AI RAY 3 が追加
当記事は広告を含みます FireflyAdobe は 9月18日(木)、Firefly のパートナーモデルに RAY 3 を追加した。 Luma AI の最新動画生成AIモデルだ。Adobe は Firefly 動画生成のパートナーモデルに新しく RAY 3 を追加した。 RAY 3 は、Luma AI による新しい動画生成AIモデルで、プロンプトの意図を理解した推論と思考による生成が可能で、HDR に対応している。 リリースと同時に Adobe Firefly...
Luma AI が Ray 3 動画生成AIモデルをリリース HDRに対応
当記事は広告を含みます Luma AILuma AI は9月18日(木)、新しい動画生成AIモデル RAY 3 をリリースした。 1月以来のメジャーアップデートとなる。Luma AI は、新しい動画生成AIモデル RAY 3 をリリースした。 RAY 3 は、視覚的な思考と推論ができ、物理演算や一貫性を高いレベルで再現できるモデルとなっており、世界初の 16bit HDR 対応によりプロ仕様の豊かな色彩, 階調表現も可能だ。 公式のプロモーション動画がこちら。最新の動画生成AIモデル...
ElevenLabs が Studio 3.0 をリリース 各機能を一元化するハブ
当記事は広告を含みます ElevenLabsElevenLabs は 9月17日(水)、新しく Studio 3.0 をリリースした。 各機能が利用できる ElevenLabs のハブとなる機能だ。ElevenLabs は、Studio 3.0 をリリースした。 Studio 3.0 では ElevenLabs の各種機能が統合されており、動画, 音声編集のワークフローを1箇所で完結させることができるようになる。 公式のプロモーション動画がこちら。Studio 3.0...