ChatGPT Image2 är Här - En Komplett Guide till Alla Möjligheter

ChatGPT Image 2 är här.

Den 21 april lade OpenAI tyst till GPT Image 2 i ChatGPT och Codex utan presskonferens, utan förhandsvisning, bara direkt. Inom 12 timmar toppade det Image Arena-rankningen med 1512 poäng, 242 poäng före andraplatsen — det största poänggapet i rankningens historia.

Som någon som länge har följt AI-bildverktyg var jag inte besviken denna gång. Efter en veckas praktiska tester har jag sammanställt en uppsättning effektiva användningsmetoder att dela med mig av idag.

ChatGPT Image 2 Användarguide

Första Saken: Var är Ingångspunkten?

Om du vill använda det direkt är det enklaste sättet via ChatGPT. Klicka på ”+“-knappen i inmatningsrutan och välj “Skapa Bild”. Gratis användare får för närvarande 2-3 bilder per dag, medan Plus-användare kan använda det kraftfullare “Tänkarläget”.

Tänkarläget tar längre tid men erbjuder högre textprecision och mer komplexa kompositionsmöjligheter. Om du har höga krav på genererade resultat rekommenderar jag att du prenumererar på Plus för att använda Tänkarläget.

Prompt Formel: Skriv Så Här och Det Blir Inget Fel

Efter en vecka av testning har jag sammanfattat en GPT Image 2-specifik prompt-formel:

【Visuell Stil】+【Scen Bakgrund】+【Kärn Subjekt】+【Preciisa Detaljer och Text】+【Layout och Begränsningar】

Ett framgångsrikt produktbild-prompt exempel:

Filmkvalitet produktfotografering. Scen inställd på mörkgrå ru stenyta med ett mörkt bakgrund med bara lite rök. Subjektet är en kvadratisk svart glasherrparfymflaska, placerad lätt lutad. Detaljer: framsidan av parfymflaskan har guld “SERIAL” engelska bokstäver i en sans-serif font, med realistiska små vattendroppar på flaskans yta. Begränsningar: enkel ljuskälla till höger med hård belysning, som kastar tydliga kontur-skuggor, hög kontrast och kall ton, inga andra objekt förutom parfymen.

Kärnan i denna formel: fastställ först stiltonen, beskriv sedan scen och subjekt, använd sedan specifika detaljer för att begränsa resultaten, använd slutligen exclusionsvillkor för att låsa det som inte ska visas.

Text-Rendering: Äntligen Inget Mer Fel

Tidigare, när jag använde AI-ritning, var det jag mest fruktade att få den att skriva kinesiska. Antingen blev det stavfel eller så förvreds texten till gibberish.

GPT Image 2 har i grunden löst detta problem i denna generation. Praktiska tester visar att korta horisontella meningar och titelstiltext har nära noll felnivå, och långa kinesiska stycken har bara ibland små problem med punkttäthet.

Nyckelteknik: Använd citattecken runt texten du vill rendera.

Oavsett om det är kinesiska eller engelska, varje specifik text som du vill se i bilden måste omges av citattecken i din prompt. Till exempel:

“Skylten säger ‘Öppet för Affärer’” “T-shirtens framsida säger ‘Skön Helg’”

Kombinerat med specifika positionsbeskrivningar som “centrerad” eller “övre vänstra hörnet”, kommer text-rendering precision att förbättras ytterligare.

Komplex Komposition: Använd Tänkarläget

För bilder som innehåller flera element och kräver exakta spatiala relationer tenderar normalläget att tappa några element. Det är här du behöver aktivera “Tänkarläget”.

Vanliga Frågor

F: Hur stor är skillnaden mellan gratis och betalversion?

Gratis version: 2-3 bilder per dag, bara direkt läge, lämplig för att prova. Betalversion (Plus, 20$/månad): kan använda Tänkarläget, dagliga gränser är mer generösa, lämplig för användare med batchbehov.

Sammanfattning

GPT Image 2 är för närvarande det AI-bildverktyg som är närmast “användbart i faktisk produktion”. Genombrottet i textrendering gör kinesiska scener äntligen pålitliga.

Börja använda GPT-image2