ChatGPT Image2가 등장 - 모든 기능의 완전한 가이드

ChatGPT Image 2가 나왔다.

4월 21일, OpenAI는 공개적으로 발표도, 프리뷰도 없이 ChatGPT와 Codex에 직접 GPT Image 2를 출시했다. 12시간 만에 Image Arena 랭킹에서 1512포인트로 1위에 올랐으며, 2위보다 242포인트 앞서았다——이는 해당 랭킹 역사상 최대 점수 차이다.

오래동안 AI 이미지 도구를 지켜봐온 사람으로서, 이번에는 실망하지 않았다. 1주일간의 실전 테스트를 거쳐 효과적인 사용 방법의一套를 정리했다.

ChatGPT Image 2 사용 가이드

첫 번째:入口はどこか

직접 사용하고 싶다면, 가장 간단한 방법은 ChatGPT를 통하는 것이다. 입력 상자의 ”+” 버튼을 클릭하고 “이미지 생성”을 선택하면 된다. 현재 무료 사용자는 매일 2~3장의 할당량이 있고, Plus 사용자는 더 강력한”思考モード”를 사용할 수 있다.

思考モード는 더 오래 걸리지만 더 높은 텍스트 정확도와 더 복잡한 구도 능력을 제공한다. 생성 결과에 대한 요구가 높다면 Plus 회원 등록하여思考モード를 사용할 것을 권한다.

프롬프트 공식: 이것만 따르면 실패하지 않는다

1주일 동안 헤맨 끝에 정리한 GPT Image 2 전용 프롬프트 공식:

【비주얼 스타일】+【장면 배경】+【핵심 주체】+【정밀한 디테일과 텍스트】+【레이아웃과 제약】

예를 들어, 성공적인 제품 이미지 프롬프트:

영화 수준의 질감 있는 제품 사진. 진회색 거친 표면의 돌 테이블에 장면 설정, 배경은 어둡고 적은 양의 연기만 있다. 주체는 약간 기울어진 정사각형 검은 유리 재질의 남성 향수一瓶. 디테일: 향수 병 전면에 산세리프 폰트로 금색”SERIAL” 영문이 인쇄되어 있고, 병 표면에는 사실적인 미세한 물방울이 맺혀 있다. 제약: 우측 단일 광원의 단단한 조명, 선명한 윤곽 그림자投射, 화면은 높은 대조도와 차가운 느낌으로 향수 외에는 어떤 것도 나타나지 않는다.

이 공식의 핵심: 먼저 스타일로 톤을 정하고,次に장면과 주체를 설명하고, 구체적인 디테일로 결과를 제약하고,最後に排除 조건으로 나타나지 않을 내용을 명확히 한다.

텍스트 렌더링: 이제 더 이상 실패하지 않는다

과거 AI 드로잉에서 가장 두려웠던 것은 中文를 쓰게 하는 것이었다. 오자가 생기거나 텍스트가 직접 깨져버렸다.

GPT Image 2는 이번 세대에서 결국 이 문제를 해결했다. 실전 테스트에서 가로 짧은 문장과 제목 스타일 텍스트의 오류율은 거의 제로에 가깝고, 긴 中文 단락도 구두점 밀도 문제가 가끔 있을 뿐이다.

핵심 기법: 원하는 텍스트를 큰따옴표로囲む.

中文이든英文이든 이미지에 나타났으면 하는 특정 텍스트는 반드시 프롬프트 내에서 큰따옴표로囲む. 예를 들어:

“간판에’영업 중’이라고 적혀 있다” “티셔츠 가슴부분에’즐거운 주말’이라고印刷”

“중앙에”, “왼쪽 상단 모서리에” 등의 구체적인 위치 설명과 함께 사용하면 텍스트 렌더링 정확도가 한 단계 더 향상된다.

복잡한 구도:思考 모드 사용

복수의 요소를 포함하고 정밀한 공간 관계가 필요한 이미지의 경우, 일반 모드에서는こちらこそ及ばない. 이때”思考 모드”를 활성화해야 한다.

예를 들어以下の 요소를含む 이미지를 생성하고 싶은 경우: 왼쪽에赤いワンピースを着た女の子がいて、真ん中に橘色の猫がいて、底部にテキストが一列ある. 복수의 요소를 동시에 제약할 때思考 모드는 더 잘 전체를统筹할 수 있다.

주의할 점은思考 모드는 매번 生成당 15~30초甚至更久시간이 걸리고, 복잡한 장면은 1분 이상 기다려야 할 수도 있다. 이는 속도를 품질과 교환하는 것이다.

편집 기능: 전체는 건드리지 않고一小部分만 변경

很多人都不知채 GPT Image 2가 부분 편집을 지원하고 있다는 것, 그리고 편집 로직이 매우 직관적이라는 것도.

편집 방법은:已有の画像をアップロードして、「何を保留」と「何を変える」を伝える.

예를 들어 이미지의 배경을屋内から海辺に変更하고 싶은 경우,「 인물과 의상은不改變して、배경을 해변의 일몰로 변경」と言えば 된다. AI는あなたの意図を理解して、主体に影響なく背景だけを変える.

이 기능은 一连串の画像を必要とするが一部要素だけ調整したい場合に非常に実用的다. 매번 전체 세트를重新生成하는 대신 一小部分を変更するだけで新しい変体が得られる。

스타일 일관성:如何让系列图看起来像一套

一系列のスタイルを一致させた画像を生成する必要がある場合, 실용적인 팁이 있다.

첫 번째 이미지를 생성한 후, 이 系列에 해당하는”Seed” 번호를 AI에게 요청할 수 있고, 이후 프롬프트 처음에以下を追加できる:

“이전 이미지와 일관된 비주얼 스타일 유지, Seed 번호: [번호] 참고하여 [구체적 요소] 수정”

스타일 관련 수식어를 템플릿에固化して、毎回連れてくる. 这样即使间隔几天操作，同一系列的图也能保持视觉统一。

자주 묻는 질문

질문: 무료版와 유료版의 차이는 크나요?

무료版: 매일 2~3장, 즉시 모드만 사용, 테스트용 적합. 유료版(Plus, 20$/월):思考 모드 사용 가능, 매일 할당량更加充裕,批量需要有用户适用.

질문: 1장 생성하는데 얼마나 걸리나요?

즉시 모드는 일반적으로 20~~60초.思考 모드는 복잡도에 따라 30초~~2분 不等. 피크 시간에는 더 걸릴 수 있다.

질문: 어떤 사이즈의 이미지를 생성할 수 있나요?

여러 비율과 사이즈 지원包括정사각형(1:1), 横版(16:9),竪版(9:16) 등. 사용场景에 따라 적절한 비율 선택.

질문: 어떤 장면에 적합하지 않나요?

복잡한 손 동작(피아노 연주, 뜨개질 등), 밀집된 군중(15인 이상), 엄격한 물리 논리가 필요한 산업 도면 등의 장면에서는 현재 모델도 높은 실패율이 있어 수동 처리 권장.

요약

GPT Image 2는 현재「실제 생산에 사용할 수 있는」에 가장 가까운 AI 이미지 도구다. 텍스트 렌더링의 breakthrough로 中文 장면이 처음으로 신뢰할 수 있게 되었고, 다중 요소 제어와 편집 기능으로 일상 업무 흐름이 더욱 효율적으로졌다.

먼저 간단한 장면부터 시작하여 모델의 능력 경계에 익숙해진 후 복잡한 구도를 시도해보자. 문제에 부딪히면 여러 번迭代, 대부분의 경우 만족스러운 결과를 얻을 수 있다.

GPT-image2 사용 시작하기