OpenAIの新たな画像生成AIモデル ChatGPT 4o Image Generatorが公開された。
これまで生成AIには不得意とされていた文字や文章の画像生成を高精度で行ったり、反射や写り込みの表現を再現したりと、より現実に近い表現ができるようアップデートされている。
こちらがOpenAI 4o画像生成の公式プロモーション動画だ。
ChatGPT 4oでの画像生成は標準仕様となっており、チャットの対話形式で生成や編集を行う。
チャットの流れを把握し、ベースとした画像をもとにバリエーションを加えつつ一貫性のある画像を生成できるのが大きな特徴だ。
また、チャット内でのプロンプトによる指示に加えて、ChatGPTがこれまでに学習した内容を盛り込んで画像生成することができる。
例では、セリフ付きの4コマ漫画、インフォグラフィック、イラスト付きのレストランのメニュー表、誰も居いない看板も白抜きされたNYタイムズスクエアの風景、などが簡単な指示で生成されている。

OpenAI

OpenAI
下の2枚の画像のように、生成した画像や参照画像をベースにして、新しく生成する画像にその要素を盛り込むことができるようになった。
人物は変えずに、服や服の色を変えたり、サングラスを追加したりなど画像編集的な生成にも対応している。


OpenAI
他にも4oでは、1枚の画像生成内に10〜20の異なるオブジェクトをプロンプトで指定したり、背景透過の画像を生成したりできる。

OpenAI
性能面が大幅に向上したGPT 4oにもまだ欠点はあるようだ。
縦長のポスター画像では上下がクロップされて生成される場合があったり、ラテン文字以外のレンダリング生成に対しては不正確であったりする問題が見られるとのこと。
ひらがな等の日本語の生成も、想定したものとは異なるものが生成されるだろう。
ChatGPT 4oによる画像生成は実装されており、利用できる状態だ。
4oを用いた画像生成は動画生成モデルSoraでも利用可能となっている。
これまでChatGPTでの画像生成を担ってきたDALL・Eは存続するが、今後の主流は4oにとって変わっていくこととなりそうだ。
ChatGPT 画像生成 OpenAI公式日本語版ページはこちら
詳細情報
ChatGPT 4o Image Generation
対象 : ChatGPT Plus, Pro, Teamプラン利用者 及び 無料ユーザー
ChatGPT 4oによる画像生成は、OpenAIのアカウントを持っているユーザーなら誰でも利用できるようになる。

OpenAI公式サイトはこちら
Tags : chatGPT Generative AI Image Model OpenAI











