Google DeepMind は 8月5日(火)、新しいワールドモデル Genie 3 を発表した。テキストプロンプトにより生成される 3D の世界を数分間にわたり、ユーザーがキー入力などの操作でリアルタイムにインタラクトすることができる。

カテゴリ内の記事を新着順に表示します。
Google DeepMind は 8月5日(火)、新しいワールドモデル Genie 3 を発表した。テキストプロンプトにより生成される 3D の世界を数分間にわたり、ユーザーがキー入力などの操作でリアルタイムにインタラクトすることができる。
ElevenLabs は 8月5日(火)、新しい音楽モデル Eleven Music をリリースした。自然言語によるテキストプロンプトから AI により様々なジャンルの楽曲を生成できる新しい生成モデルだ。日本語を含む多言語での歌詞付き楽曲生成にも対応。
Ideogram は7月29日(火)、新機能 Ideogram Character をリリースした。人間, 動物など特定の被写体の写真1枚から、一貫性のあるキャラクターの様々なバリエーション画像を生成できるモデルとなる。
Adobe は7月29日(火)、Photoshop に調和, 生成アップスケールなどの新機能を追加した。調和は、ワンクリックで画像を合成させることができる機能だ。合成する画像の背景を Firefly Image Model により自動で分析し、ライティングや影、トーンの調整などが行われる。
Luma AI は7月30日(水)、新機能 Modify with Instruction をリリースした。動画から動画 (video-to-video, v2v) 編集機能で、自然言語によるプロンプトでオブジェクトの追加, 削除、VFXの追加、シーンの変更などがより直感的にできるようになった。
当記事は広告を含みます xAIxAI は 8月5日(火)、Grok に新しく Grok Imagine を実装しユーザーへの展開を開始した。 AI 画像, 動画の生成ができる機能だ。xAI は 対話型生成AIアシスタント Grok に Grok Imagine を実装した。 Grok Imagine は、AI画像, 動画生成に特化した機能で、高速生成と、"ある"モードの実装で大きく話題となっている。Grok Imagine の特徴 ・高速生成 : 一般的な他の画像,...
当記事は広告を含みます HiggsfieldHiggsfield は 8月5日(火)、新機能 Upscale を実装した。 動画, 画像をAIにより高解像度化できる機能だ。Higgsfield は Upscale (アップスケール) 機能の追加 を発表した。 Upscale は、AI により画像, 動画を高解像度化するもので Topaz Labs による技術を採用している。 画像は最大16倍, 動画 は最大 8K までのアップスケールに対応。画像アップスケーラー...
当記事は広告を含みます GoogleGoogle DeepMind は 8月5日(火)、新しいワールドモデル Genie 3 を発表した。 インタラクティブな汎用ワールドモデルだ。Google DeepMind は、 ワールドモデル Genie のメジャーアップデートを発表した。 最新のモデル Genie 3 では、テキストプロンプトにより生成される 3D の世界を、ユーザーがキー入力などの操作でリアルタイムにインタラクトすることができる。 公式の YouTube...