ChatGPT Image2来了 - 完整使用指南

ChatGPT Image 2がやってきた。

4月21日、OpenAIは发布会もなく、プレビューもなく、ChatGPTとCodexに直接GPT Image 2を投入した。12時間以内にImage Arenaランキングで1512ポイントを獲得して1位になり、2位より242ポイントの差をつけた——これはランキング史上最大の差だった。

AI画像ツールを長く追ってきた者として、今回は失望しなかった。1週間の実践テストを経て、効果的な使用方法的一套をまとめてみた。

ChatGPT Image 2 使い方ガイド

最初のこと：入口在哪里

直接使用したい場合は、ChatGPT経由が最も簡単だ。入力ボックスの”+“ボタンをクリックして”画像を作成”を選択。目前無料ユーザーは毎日2〜3枚のクォータがあり、Plusユーザーはより強力な”思考モード”，可以使用できる。

思考モードはより時間がかかるが、より高いテキスト精度とより複雑な構図能力が手に入る。生成結果への要求が高い場合は、Plus会员に登録して思考モードを使用することをおすすめする。

プロンプト式：これを書いていれば失敗しない

1週間費やしてまとめ上げたGPT Image 2専用のプロンプト式：

【視覚スタイル】+【シーン背景】+【コア主体】+【精密詳細とテキスト】+【レイアウトと制約】

例として、成功した製品画像のプロンプト：

映画レベルの質感のある製品写真。深い灰色の粗糙な石材のテーブル表面にシーンを設定し、背景は暗く少量の煙だけがある。主体は傾斜して置かれた正方形の黒いガラスの男性のコラー一瓶。詳細：コラー車の正面にサンセリフフォントで金色”的”SERIAL”という英字が印刷されており、車体表面にはリアルな微小な水滴が滴っている。制約：右側の単一光源の硬質照明で、クリアな輪郭影を投射し、画面は高コントラストで冷たい質感でコラー以外は何も出現しない。

この式の核心：まずスタイルで基調を定め、次にシーンと主体を言い、具体的な詳細で結果を制約し、最後に出現しない内容を排除条件ではっきりさせる。

テキスト渲染：ようやく失敗しなくなった

過去のAI描画で何より怕かったのは中文を書かせることだった。誤字要么是文字が直接化け物になった。

GPT Image 2はこの世代でようやくこの問題を解決した。実践テストでは横書き短文やタイトル類テキストのエラー率はほぼゼロに近く、長い中文の段落も句読点密度の問題が時折あるだけだ。

コツ：書きたいテキストを二重引用符で囲む。

中文でも英文でも、画像に出現させたい特定のテキストは必ずプロンプト内で二重引用符で囲む。例えば：

「看板に’営業時間中’と書いている」「T恤の胸元に’楽しい週末’と印刷」

「中央に」「左上隅に」などの具体的な位置描述を組み合わせると、テキスト渲染の精度がもう一段上がる。

複雑な構図：思考モードを使う

複数の要素を含み、精確な空間関係が必要な画像には、ノーマルモードでは片不及お在那里。这时需要打开”思考モード”。

例えば以下の要素を含む画像を生成したい場合：左側に赤いワンピースを着た女の子がいて、真ん中に橘色の猫がいて、底部にテキストが一列ある。複数の要素を同時に制約する場合、思考モードはよりよく全体を统筹できる。

注意点として、思考モードは1回あたり15〜30秒甚至更久時間かかり、複雑なシーンは1分以上待つ必要があるかもしれない。これは速度を品質と交換すること。

編集機能：全身は変えず一小部分だけ

ChatGPT Image 2が部分編集をサポートしていること、そして編集ロジックが非常に直感的であることは知らなかった人が多い。

編集の方法は：已有の画像をアップロードして、「何を保留」と「何を変える」を伝える。

例えば画像の背景を屋内から海辺に変更したい場合、「人物と服装を不改變して、背景を海辺の日落ちに変更」と言えばいい。AIはあなたの意図を理解して、主体に影響なく背景だけを変える。

この機能は、一连串の画像を必要とするが一部要素だけ調整したい場合に非常に実用的だ。一连串を毎回重新生成するのではなく、一小部分を変更するだけで新しい変体が得られる。

スタイル一貫性：如何让系列图看起来像一套

一连串のスタイルを一致させた画像を生成する必要がある場合、实用的なコツがある。

最初の画像を生成した後、この一连串に対応する”Seed”番号をAIに請求でき、以降のプロンプトの最初に以下を追加できる：

「以前の画像と一貫した視覚スタイルを保持し、Seed番号：[番号]を参考して、[具体的な要素]を変更」

スタイル関連の修飾詞をテンプレートに固化して、毎回連れてくる。这样即使间隔几天操作，同一系列的图也能保持视觉统一。

よくある問題

質問：無料版と有料版の違いは大きいですか？

無料版：毎日2〜3枚、即時モードのみ、お試に最適。有料版（Plus、20ドル/月）：思考モード，每日クォータ更加充足批量需要有用户向け。

質問：1枚生成するのにどれくらいの時間がかかりますか？

即時モードは通常20〜60秒。思考モードは複雑さによって30秒〜2分不等。ピーク時はより遅い場合がある。

質問：どのサイズの画像を生成できますか？

多种比例と尺寸に対応包括正方形（1:1）、横版（16:9）、竪版（9:16）など。使用场景に応じて適切な比例を選択。

質問：どのシーンに適していませんか？

複雑な手的動作（ピアノ演奏、編み物など）、密集人群（15人以上）、厳密な物理論理が必要な工業图纸などのシーンでは、現在のモデルでも高い失敗率があり、人工処理おすすめ。

まとめ

GPT Image 2は現時点で最も「実際の生産に使用できる」に近いAI画像ツールだ。テキスト渲染の breakthroughにより中文シーンが初めて信用できるようになり、多要素制御と編集機能により日常工作の流れがさらに効率的になった。

まずはシンプルなシーンから始めて、モデルの能力境界熟悉后再尝试复杂构図。遇到问题时多次迭代，大多数情况下都能得到满意的结果。

GPT-image2を使用开始する