ChatGPT Image2 มาแล้ว - คู่มือฉบับสมบูรณ์

ChatGPT Image 2 มาแล้ว

เมื่อวันที่ 21 เมษายน OpenAI ได้เพิ่ม GPT Image 2 โดยไม่มีการประกาศ ไม่มีการแสดงตัวอย่าง เพียงแค่เปิดตัวใน ChatGPT และ Codex ภายใน 12 ชั่วโมง มันขึ้นอันดับ 1 ในตารางจัดอันดับ Image Arena ด้วยคะแนน 1512 นำหน้าอันดับที่สอง 242 คะแนน — นี่คือช่องว่างคะแนนที่ใหญ่ที่สุดในประวัติศาสตร์ของตาราง

ในฐานะที่เป็นผู้ติดตามเครื่องมือสร้างภาพ AI มานาน ครั้งนี้ฉันไม่ต้องผิดหวัง หลังจากทดสอบจริงหนึ่งสัปดาห์ ฉันได้รวบรวมชุดวิธีการใช้งานที่มีประสิทธิภาพมาแบ่งปันให้คุณวันนี้

ChatGPT Image 2 คู่มือการใช้งาน

สิ่งแรก: จุดเข้าใช้งานอยู่ที่ไหน

หากต้องการใช้งานโดยตรง วิธีที่ง่ายที่สุดคือผ่าน ChatGPT คลิกปุ่ม ”+” ในกล่องป้อนข้อมูลแล้วเลือก “สร้างภาพ” ผู้ใช้งานฟรีในปัจจุบันได้รับโควตา 2-3 ภาพต่อวัน ส่วนผู้ใช้ Plus สามารถใช้ “โหมดความคิด” ที่ทรงพลังกว่าได้

โหมดความคิดใช้เวลามากขึ้น แต่แลกมาด้วยความแม่นยำของข้อความที่สูงกว่าและความสามารถในการจัดองค์ประกอบที่ซับซ้อนกว่า หากคุณต้องการความต้องการสูงสำหรับผลลัพธ์ที่สร้าง ฉันแนะนำให้สมัครสมาชิก Plus เพื่อใช้โหมดความคิด

สูตรพรอมต์: เขียนแบบนี้แล้วไม่มีวันล้มเหลว

หลังจากทดสอบมาหนึ่งสัปดาห์ ฉันได้สรุปสูตรพรอมต์เฉพาะสำหรับ GPT Image 2:

【สไตล์ภาพ】+【พื้นหลังฉาก】+【วัตถุหลัก】+【รายละเอียดและข้อความที่แม่นยำ】+【การจัดวางและข้อจำกัด】

ตัวอย่างเช่น พรอมต์ภาพผลิตภัณฑ์ที่ประสบความสำเร็จ:

ถ่ายภาพผลิตภัณฑ์ระดับภาพยนตร์ ฉากบนพื้นผิวหินสีเทาเข้มหยาบ พื้นหลังมืดมีควันเล็กน้อย วัตถุหลักคือขวดน้ำหอมชายสีดำทรงสี่เหลี่ยมวางเอียงเล็กน้อย รายละเอียด: ด้านหน้าขวดน้ำหอมมีตัวอักษรภาษาอังกฤษสีทอง “SERIAL” พิมพ์ด้วยฟอนต์ไม่มีเส้นขอบ บนผิวขวดมีหยดน้ำเล็กๆ สมจริง ข้อจำกัด: แสงเดียวด้านขวาฉายเงาที่ชัดเจน ความเปรียบต่างสูงและโทนเย็น ไม่มีวัตถุอื่นนอกจากน้ำหอม

แก่นของสูตรนี้: กำหนดโทนสไตล์ก่อน จากนั้นอธิบายฉากและวัตถุ แล้วใช้รายละเอียดเฉพาะเพื่อจำกัดผลลัพธ์ สุดท้ายใช้เงื่อนไขการตัดออกเพื่อล็อคสิ่งที่ไม่ต้องการ

การเรนเดอร์ข้อความ: ในที่สุดก็ไม่มีวันล้มเหลว

ในอดีตการใช้ AI วาดภาพ สิ่งที่กลัวมากที่สุดคือให้มันเขียนภาษาจีน จะเป็นตัวสะกดผิด หรือตัวอักษรเพี้ยน

GPT Image 2 ได้แก้ปัญหานี้อย่างมูลฐานในยุคนี้ การทดสอบพบว่าประโยคสั้นแนวนอนและข้อความรูปแบบหัวข้อมีอัตราความผิดพลาดใกล้ศูนย์ ย่อหน้าภาษาจีนยาวมีปัญหาเล็กน้อยเรื่องความหนาแน่นของเครื่องหมายวรรคตอนเท่านั้น

เทคนิคหลัก: ใช้เครื่องหมายอัญประกาศคู่ล้อมรอบข้อความที่ต้องการเรนเดอร์

ไม่ว่าจะเป็นภาษาจีนหรือภาษาอังกฤษ ข้อความเฉพาะใดๆ ที่ต้องการให้ปรากฏในภาพต้องอยู่ในเครื่องหมายอัญประกาศคู่ในพรอมต์ ตัวอย่างเช่น:

“ป้ายเขียนว่า ‘เปิดให้บริการ’” “เสื้อยืดหน้าอกมีข้อความว่า ‘สุขสัปดาห์ดี‘“

โหมดความคิด: สำหรับองค์ประกอบที่ซับซ้อน

สำหรับภาพที่มีหลายองค์ประกอบและต้องการความสัมพันธ์เชิงพื้นที่แม่นยำ โหมดปกติอาจลืมองค์ประกอบบางส่วน ต้องเปิด “โหมดความคิด”

คำถามที่พบบ่อย

ถาม: ผู้ใช้ฟรีและแบบจ่ายต่างกันมากไหม?

ผู้ใช้ฟรี: 2-3 ภาพต่อวัน ใช้ได้เฉพาะโหมดทันที เหมาะสำหรับลองใช้ ผู้ใช้แบบจ่าย (Plus, 20$ต่อเดือน): สามารถใช้โหมดความคิดได้

สรุป

GPT Image 2 คือเครื่องมือสร้างภาพ AI ที่ใกล้เคียงที่สุดกับ “พร้อมใช้งานจริงในการผลิต” ความก้าวหน้าด้านการเรนเดอร์ข้อความทำให้ฉากภาษาจีนเชื่อถือได้ในที่สุด

แนะนำให้เริ่มจากฉากง่ายๆ ก่อน คุ้นเคยกับขอบเขตความสามารถของโมเดล แล้วค่อยลององค์ประกอบที่ซับซ้อน

เริ่มใช้ GPT-image2