OpenAIの新たな画像生成AIモデル ChatGPT 4o Image Generatorが公開された。
これまで生成AIには不得意とされていた文字や文章の画像生成を高精度で行ったり、反射や写り込みの表現を再現したりと、より現実に近い表現ができるようアップデートされている。
こちらがOpenAI 4o画像生成の公式プロモーション動画だ。
ChatGPT 4oでの画像生成は標準仕様となっており、チャットの対話形式で生成や編集を行う。
チャットの流れを把握し、ベースとした画像をもとにバリエーションを加えつつ一貫性のある画像を生成できるのが大きな特徴だ。
また、チャット内でのプロンプトによる指示に加えて、ChatGPTがこれまでに学習した内容を盛り込んで画像生成することができる。
例では、セリフ付きの4コマ漫画、インフォグラフィック、イラスト付きのレストランのメニュー表、誰も居いない看板も白抜きされたNYタイムズスクエアの風景、などが簡単な指示で生成されている。

OpenAI

OpenAI
下の2枚の画像のように、生成した画像や参照画像をベースにして、新しく生成する画像にその要素を盛り込むことができるようになった。
人物は変えずに、服や服の色を変えたり、サングラスを追加したりなど画像編集的な生成にも対応している。


OpenAI
他にも4oでは、1枚の画像生成内に10〜20の異なるオブジェクトをプロンプトで指定したり、背景透過の画像を生成したりできる。

OpenAI
性能面が大幅に向上したGPT 4oにもまだ欠点はあるようだ。
縦長のポスター画像では上下がクロップされて生成される場合があったり、ラテン文字以外のレンダリング生成に対しては不正確であったりする問題が見られるとのこと。
ひらがな等の日本語の生成も、想定したものとは異なるものが生成されるだろう。
ChatGPT 4oによる画像生成は実装されており、利用できる状態だ。
4oを用いた画像生成は動画生成モデルSoraでも利用可能となっている。
これまでChatGPTでの画像生成を担ってきたDALL・Eは存続するが、今後の主流は4oにとって変わっていくこととなりそうだ。
ChatGPT 画像生成 OpenAI公式日本語版ページはこちら
詳細情報
ChatGPT 4o Image Generation
対象 : ChatGPT Plus, Pro, Teamプラン利用者 及び 無料ユーザー
ChatGPT 4oによる画像生成は、OpenAIのアカウントを持っているユーザーなら誰でも利用できるようになる。

OpenAI公式サイトはこちら
OpenAI 関連記事

ChatGPT 4o 画像生成 無料ユーザーへの対応延期 急激なアクセス集中により
当記事は広告を含みます OpenAIOpenAIは3月25日に公開した、ChatGPT 4oの標準仕様として実装した画像生成機能の利用を一時的に制限している。 対象は無料ユーザーで、利用者の急増が原因だ。3月25日に公開された、OpenAIの新たな画像生成AIモデル ChatGPT 4o Image Generatorが好評だ。 しかし現在、無料ユーザーへの画像生成機能を一時的に見合わせている。 これは、GPT 4oの画像生成機能の公開後、想定を上回り画像生成の利用が急増したためである。...

OpenAI Soraの料金プランが変更 クレジット制から無制限に動画生成が可能に
当記事は広告を含みます SoraOpen AIは、2025年 3月22日(土) 動画生成モデルSoraの料金プランを変更し、従来のクレジット制を廃止し無制限の動画生成が可能となった。 プラン内容の変更に伴う価格変更はない。OpenAIの動画生成モデル Sora のプラン内容が変更され、動画生成を従来のクレジット制から無制限に利用できるようになった。 プランは変更前と変わらずPlusとProの2種類で、特徴は以下の様になる。 ChatGPT Plus $20/月, 無制限の動画生成,...
あわせて読みたい

Google Gemini 2.5 Flash Image がリリース Nano Banana で話題の高性能な画像編集モデル
対話型生成AIアシスタント Google Gemini に、新しい画像生成, 編集モデル Gemini 2.5 Flash Image モデルが実装された。Nano Banana として発表前から注目を集めていたモデルだ。

MeshyAI が Meshy 5 をリリース Proプラン 50%OFFキャンペーンも
MeshyAI は8月8日(金)、 新しい 3D生成AIモデル Meshy 5 をリリースした。3月にプレビュー版として提供されていた Meshy 5 Preview からのメジャーアップデートとなっている。

Grok Imagine が登場 画像, 音声付き動画生成機能が実装 Spicyモードも
xAI は 8月5日(火)、Grok に新しく Grok Image を実装しユーザーへの展開を開始した。画像, 動画生成に対応し、高速生成や Spicy モードでの生成が大きな特徴。

Higgsfield が Upscale を実装 Topaz Labs によるアップスケーラー 画像, 動画に対応
Higgsfield は 8月5日(火)、Upscale を実装した。Upscale は、AI により画像, 動画を高解像度化するもので Topaz Labs による技術を採用している。画像は最大16倍, 動画 は最大 8K までのアップスケールに対応。

Google DeepMind が Genie 3 を発表 インタラクティブなワールドモデル
Google DeepMind は 8月5日(火)、新しいワールドモデル Genie 3 を発表した。テキストプロンプトにより生成される 3D の世界を数分間にわたり、ユーザーがキー入力などの操作でリアルタイムにインタラクトすることができる。

ElevenLabs が Eleven Music をリリース テキストから音楽生成が可能に
ElevenLabs は 8月5日(火)、新しい音楽モデル Eleven Music をリリースした。自然言語によるテキストプロンプトから AI により様々なジャンルの楽曲を生成できる新しい生成モデルだ。日本語を含む多言語での歌詞付き楽曲生成にも対応。

Ideogram Character をリリース 1枚の画像から一貫性のあるキャラクター作成
Ideogram は7月29日(火)、新機能 Ideogram Character をリリースした。人間, 動物など特定の被写体の写真1枚から、一貫性のあるキャラクターの様々なバリエーション画像を生成できるモデルとなる。

Luma AI が Modify with Instructions をリリース 自然言語で動画を編集
Luma AI は7月30日(水)、新機能 Modify with Instruction をリリースした。動画から動画 (video-to-video, v2v) 編集機能で、自然言語によるプロンプトでオブジェクトの追加, 削除、VFXの追加、シーンの変更などがより直感的にできるようになった。
design-offset.com
新着記事
【2025年版】Adobe フォトプラン 法人, グループ版 について解説
当記事は広告を含みます Photography PlanAdobe Creative Cloud フォトプラン グループ版 (法人版) について説明していきます。 また、個人版での利用についても解説しています。CONTENTS フォトプラン とは フォトプラン グループ版 のプランと価格 法人版, グループ版の特徴とメリット 個人版プランの利用について まとめCretive Cloud グループ版 公式ページはこちら...
【2025年版】Creative Cloud Standard 法人, グループ版について解説
当記事は広告を含みます Creative CloudAdobe Creative Cloud Standard グループ版 (法人版) ついて説明していきます。 また、個人版での利用についても解説しています。CONTENTS Creative Cloud Standard とは Creative Cloud Standard グループ版 のプランと価格 法人版, グループ版の特徴とメリット 個人版プランの利用について まとめCretive...
Adobe Premiere Rush の提供終了を発表 サポート終了は2026年
当記事は広告を含みます Premiere RushAdobe は 9月4日(木)、動画編集アプリ Premiere Rush の提供,サポート終了を発表した。 今後は Premiere Pro モバイルアプリが提供される。Adobe は Premiere Rush の提供及びサポートの終了を発表した。 2018年の登場以降、初心者でも扱いやすい簡易的な動画編集ツールとして一定の人気を誇った Premiere Rush が姿を消すこととなった。Premiere Rush は...