当記事は広告を含みます

OpenAI

ChatGPT 4o Image Generation がリリース 一貫性のある画像や背景透過の画像の生成が可能に

Publish Date on 03/29/2025

OpenAIは3月25日、マルチモーダル画像生成AIモデル ChatGPT 4o Image Generationを公開した。

プロンプトの意味を正確にとらえ、より写真に近い画像の生成が可能となっている。

Categories : OpenAI | NEWS

OpenAIの新たな画像生成AIモデル ChatGPT 4o Image Generatorが公開された。

これまで生成AIには不得意とされていた文字や文章の画像生成を高精度で行ったり、反射や写り込みの表現を再現したりと、より現実に近い表現ができるようアップデートされている。

こちらがOpenAI 4o画像生成の公式プロモーション動画だ。

ChatGPT 4oでの画像生成は標準仕様となっており、チャットの対話形式で生成や編集を行う。

チャットの流れを把握し、ベースとした画像をもとにバリエーションを加えつつ一貫性のある画像を生成できるのが大きな特徴だ。

また、チャット内でのプロンプトによる指示に加えて、ChatGPTがこれまでに学習した内容を盛り込んで画像生成することができる。

例では、セリフ付きの4コマ漫画、インフォグラフィック、イラスト付きのレストランのメニュー表、誰も居いない看板も白抜きされたNYタイムズスクエアの風景、などが簡単な指示で生成されている。

OpenAI

OpenAI

下の2枚の画像のように、生成した画像や参照画像をベースにして、新しく生成する画像にその要素を盛り込むことができるようになった。

人物は変えずに、服や服の色を変えたり、サングラスを追加したりなど画像編集的な生成にも対応している。

OpenAI

他にも4oでは、1枚の画像生成内に10〜20の異なるオブジェクトをプロンプトで指定したり、背景透過の画像を生成したりできる。

OpenAI

性能面が大幅に向上したGPT 4oにもまだ欠点はあるようだ。

縦長のポスター画像では上下がクロップされて生成される場合があったり、ラテン文字以外のレンダリング生成に対しては不正確であったりする問題が見られるとのこと。

ひらがな等の日本語の生成も、想定したものとは異なるものが生成されるだろう。

 

ChatGPT 4oによる画像生成は実装されており、利用できる状態だ。

4oを用いた画像生成は動画生成モデルSoraでも利用可能となっている。

これまでChatGPTでの画像生成を担ってきたDALL・Eは存続するが、今後の主流は4oにとって変わっていくこととなりそうだ。

ChatGPT 画像生成 OpenAI公式日本語版ページはこちら

関連記事 : Firefly ボードに ChatGPT 画像生成 が追加

詳細情報

ChatGPT 4o Image Generation

対象 : ChatGPT Plus, Pro, Teamプラン利用者 及び 無料ユーザー

ChatGPT 4oによる画像生成は、OpenAIのアカウントを持っているユーザーなら誰でも利用できるようになる。

OpenAI公式サイトはこちら

https://openai.com

Last Updated on 12/06/2025