当記事は広告を含みます

OpenAI

ChatGPT 4o Image Generation がリリース 一貫性のある画像や背景透過の画像の生成が可能に

Publish Date on 03/29/2025

OpenAIは3月25日、マルチモーダル画像生成AIモデル ChatGPT 4o Image Generationを公開した。

プロンプトの意味を正確にとらえ、より写真に近い画像の生成が可能となっている。

Categories : OpenAI | NEWS

OpenAIの新たな画像生成AIモデル ChatGPT 4o Image Generatorが公開された。

これまで生成AIには不得意とされていた文字や文章の画像生成を高精度で行ったり、反射や写り込みの表現を再現したりと、より現実に近い表現ができるようアップデートされている。

こちらがOpenAI 4o画像生成の公式プロモーション動画だ。

ChatGPT 4oでの画像生成は標準仕様となっており、チャットの対話形式で生成や編集を行う。

チャットの流れを把握し、ベースとした画像をもとにバリエーションを加えつつ一貫性のある画像を生成できるのが大きな特徴だ。

また、チャット内でのプロンプトによる指示に加えて、ChatGPTがこれまでに学習した内容を盛り込んで画像生成することができる。

例では、セリフ付きの4コマ漫画、インフォグラフィック、イラスト付きのレストランのメニュー表、誰も居いない看板も白抜きされたNYタイムズスクエアの風景、などが簡単な指示で生成されている。

他にも4oでは、1枚の画像生成内に10〜20の異なるオブジェクトをプロンプトで指定したり、背景透過の画像を生成したりできる。

 

性能面が大幅に向上したGPT 4oにもまだ欠点はあるようだ。

縦長のポスター画像では上下がクロップされて生成される場合があったり、ラテン文字以外のレンダリング生成に対しては不正確であったりする問題が見られるとのこと。

ひらがな等の日本語の生成も、想定したものとは異なるものが生成されるだろう。

 

ChatGPT 4oによる画像生成は実装されており、利用できる状態だ。

4oを用いた画像生成は動画生成モデルSoraでも利用可能となっている。

これまでChatGPTでの画像生成を担ってきたDALL・Eは存続するが、今後の主流は4oにとって変わっていくこととなりそうだ。

詳細情報

ChatGPT 4o Image Generation

対象 : ChatGPT Plus, Pro, Teamプラン利用者 及び 無料ユーザー

ChatGPT 4oによる画像生成は、OpenAIのアカウントを持っているユーザーなら誰でも利用できるようになる。

OpenAI公式サイトはこちら

https://openai.com

Last Updated on 04/09/2025

OpenAI 関連記事

ChatGPT 4o 画像生成 無料ユーザーへの対応延期 急激なアクセス集中により

ChatGPT 4o 画像生成 無料ユーザーへの対応延期 急激なアクセス集中により

当記事は広告を含みます OpenAIOpenAIは3月25日に公開した、ChatGPT 4oの標準仕様として実装した画像生成機能の利用を一時的に制限している。 対象は無料ユーザーで、利用者の急増が原因だ。3月25日に公開された、OpenAIの新たな画像生成AIモデル ChatGPT 4o Image Generatorが好評だ。 しかし現在、無料ユーザーへの画像生成機能を一時的に見合わせている。 これは、GPT 4oの画像生成機能の公開後、想定を上回り画像生成の利用が急増したためである。...

OpenAI Soraの料金プランが変更 クレジット制から無制限に動画生成が可能に

OpenAI Soraの料金プランが変更 クレジット制から無制限に動画生成が可能に

当記事は広告を含みます SoraOpen AIは、2025年 3月22日(土) 動画生成モデルSoraの料金プランを変更し、従来のクレジット制を廃止し無制限の動画生成が可能となった。 プラン内容の変更に伴う価格変更はない。OpenAIの動画生成モデル Sora のプラン内容が変更され、動画生成を従来のクレジット制から無制限に利用できるようになった。 プランは変更前と変わらずPlusとProの2種類で、特徴は以下の様になる。 ChatGPT Plus $20/月, 無制限の動画生成,...

あわせて読みたい

Runway が AMC Networks とのパートナーシップを締結

Runway が AMC Networks とのパートナーシップを締結

Runway は6月4日(水)、 アメリカの AMC Networks とのパートナーシップ提携を発表した。AMC Networks のマーケティングおよびテレビ番組の開発プロセスに Runway のAIモデルとツールを導入するとしている。

Higgsfield Speak をリリース 最大13秒 アバターが喋る

Higgsfield Speak をリリース 最大13秒 アバターが喋る

Higgsfield は6月6日(金)、新機能として Speak をリリースしたことを発表した。ただのリップシンク動画とは異なり、ボディランゲージや感情などの動きを表現することもできるようになっている。最大13秒の Speak 動画の生成が可能。英語、日本語やスペイン語など多言語に対応。

Luma AI が Modify Video をリリース RAY2 を用いた動画編集機能

Luma AI が Modify Video をリリース RAY2 を用いた動画編集機能

Luma AI は6月5日(火)、新機能 Modify Video をリリースした。動画内のオブジェクトの動き, カメラワーク, キャラクターなどを損なうことなく、環境やライティング, 質感を動画生成AIモデル RAY2 を用いて再構築できる。Dream Machine 内にて利用可能だ。

Odyssey が生成AIによる インタラクティブビデオ の研究プレビューを公開

Odyssey が生成AIによる インタラクティブビデオ の研究プレビューを公開

Odyssey は5月29日(木)、ワールドモデル生成AIによる インタラクティブビデオ の研究プレビューを公開した。インタラクティブビデオでは、空間的な整合性を保ちつつ、5分以上にわたって一貫したストーリー展開が可能。さらに、40ミリ秒ごとに新しいリアルなフレームを生成, 配信できるという性能を持つ。

Runway Gen-4 References に Layout Sketch を追加

Runway Gen-4 References に Layout Sketch を追加

Runway は5月29日(木)、Gen-4 References 画像生成に新しく Layout Sketch 機能を追加したことを発表した。ブラシツールによるフリーハンドのスケッチや、四角, 三角, 丸などの基本形状の利用が可能。

画像生成AIモデル FLUX.1 Kontext を Black Forest Labs がリリース

画像生成AIモデル FLUX.1 Kontext を Black Forest Labs がリリース

Black Forest Labs は5月30日(金)、新しい画像生成AIモデルスイート FLUX.1 Kontext をリリースした。FLUX.1 Kontext は、優れたプロンプトの再現性やテキストのレンダリング性能、フォトリアルな描写力を備え、一貫した画像の生成や、画像内の局所的な編集、スタイルの参照が行える。

design-offset.com

新着記事

Runway が AMC Networks とのパートナーシップを締結

当記事は広告を含みます RunwayRunway は6月4日(水)、 アメリカの AMC Networks とのパートナーシップ提携を発表した。 世界的にも有名な作品を輩出しているエンターテインメント会社だ。Runwayは、アメリカの国際的エンターテインメント会社 AMC Networks とのパートナーシップ提携を発表した。 AMC Networks のマーケティングおよびテレビ番組の開発プロセスに Runway のAIモデルとツールを導入するとしている。 RunwayAMC...

Adobe Firefly ボードで Google Veo 3 が利用可能に

当記事は広告を含みます FireflyAdobeは6月7日(土)、Firefly ボードで利用できる動画生成AIモデルに Veo 3 を新たに追加した。 前モデルの Veo 2 も引き続き利用可能だ。Adobe は Firefly ボードで利用できる動画生成AIモデルに、新しく Veo 3 を追加した。 Veo 3 は 5月21日に発表された Google の最新動画生成AIモデルだ。Veo 3 は、高品質な映像の生成に加え、映像に合わせた音声や効果音などを同時に生成できるモデルだ。...

ElevenLabs が Eleven v3 を発表 マルチスピーカー対応で感情も表現

当記事は広告を含みます ElevenLabsElevenLabs は6月6日(金)、新たな Text-to-Speech モデル Eleven v3 をリリースした。 マルチスピーカー対応で、感情の表現が可能なモデルとなっている。ElevenLabs は、新しい Text-to-Speech (TTS)生成AIモデル Eleven v3 (Arpha) をリリースした。 Eleven v3...