ChatGPT Image2 มาแล้ว - คู่มือฉบับสมบูรณ์
ChatGPT Image 2 โมเดลสร้างภาพล่าสุดจาก OpenAI บรรลุความก้าวหน้าทางคุณภาพในด้านการเรนเดอร์ข้อความ การควบคุมหลายองค์ประกอบ และความสม่ำเสมอนของสไตล์ บทความนี้อธิบายรายละเอียดเกี่ยวกับเทคนิคการใช้งานและวิธีเขียนพรอมต์ต่างๆ สำหรับ ChatGPT Image 2
ChatGPT Image 2 มาแล้ว
เมื่อวันที่ 21 เมษายน OpenAI ได้เพิ่ม GPT Image 2 โดยไม่มีการประกาศ ไม่มีการแสดงตัวอย่าง เพียงแค่เปิดตัวใน ChatGPT และ Codex ภายใน 12 ชั่วโมง มันขึ้นอันดับ 1 ในตารางจัดอันดับ Image Arena ด้วยคะแนน 1512 นำหน้าอันดับที่สอง 242 คะแนน — นี่คือช่องว่างคะแนนที่ใหญ่ที่สุดในประวัติศาสตร์ของตาราง
ในฐานะที่เป็นผู้ติดตามเครื่องมือสร้างภาพ AI มานาน ครั้งนี้ฉันไม่ต้องผิดหวัง หลังจากทดสอบจริงหนึ่งสัปดาห์ ฉันได้รวบรวมชุดวิธีการใช้งานที่มีประสิทธิภาพมาแบ่งปันให้คุณวันนี้

สิ่งแรก: จุดเข้าใช้งานอยู่ที่ไหน
หากต้องการใช้งานโดยตรง วิธีที่ง่ายที่สุดคือผ่าน ChatGPT คลิกปุ่ม ”+” ในกล่องป้อนข้อมูลแล้วเลือก “สร้างภาพ” ผู้ใช้งานฟรีในปัจจุบันได้รับโควตา 2-3 ภาพต่อวัน ส่วนผู้ใช้ Plus สามารถใช้ “โหมดความคิด” ที่ทรงพลังกว่าได้
โหมดความคิดใช้เวลามากขึ้น แต่แลกมาด้วยความแม่นยำของข้อความที่สูงกว่าและความสามารถในการจัดองค์ประกอบที่ซับซ้อนกว่า หากคุณต้องการความต้องการสูงสำหรับผลลัพธ์ที่สร้าง ฉันแนะนำให้สมัครสมาชิก Plus เพื่อใช้โหมดความคิด
สูตรพรอมต์: เขียนแบบนี้แล้วไม่มีวันล้มเหลว
หลังจากทดสอบมาหนึ่งสัปดาห์ ฉันได้สรุปสูตรพรอมต์เฉพาะสำหรับ GPT Image 2:
【สไตล์ภาพ】+【พื้นหลังฉาก】+【วัตถุหลัก】+【รายละเอียดและข้อความที่แม่นยำ】+【การจัดวางและข้อจำกัด】
ตัวอย่างเช่น พรอมต์ภาพผลิตภัณฑ์ที่ประสบความสำเร็จ:
ถ่ายภาพผลิตภัณฑ์ระดับภาพยนตร์ ฉากบนพื้นผิวหินสีเทาเข้มหยาบ พื้นหลังมืดมีควันเล็กน้อย วัตถุหลักคือขวดน้ำหอมชายสีดำทรงสี่เหลี่ยมวางเอียงเล็กน้อย รายละเอียด: ด้านหน้าขวดน้ำหอมมีตัวอักษรภาษาอังกฤษสีทอง “SERIAL” พิมพ์ด้วยฟอนต์ไม่มีเส้นขอบ บนผิวขวดมีหยดน้ำเล็กๆ สมจริง ข้อจำกัด: แสงเดียวด้านขวาฉายเงาที่ชัดเจน ความเปรียบต่างสูงและโทนเย็น ไม่มีวัตถุอื่นนอกจากน้ำหอม
แก่นของสูตรนี้: กำหนดโทนสไตล์ก่อน จากนั้นอธิบายฉากและวัตถุ แล้วใช้รายละเอียดเฉพาะเพื่อจำกัดผลลัพธ์ สุดท้ายใช้เงื่อนไขการตัดออกเพื่อล็อคสิ่งที่ไม่ต้องการ
การเรนเดอร์ข้อความ: ในที่สุดก็ไม่มีวันล้มเหลว
ในอดีตการใช้ AI วาดภาพ สิ่งที่กลัวมากที่สุดคือให้มันเขียนภาษาจีน จะเป็นตัวสะกดผิด หรือตัวอักษรเพี้ยน
GPT Image 2 ได้แก้ปัญหานี้อย่างมูลฐานในยุคนี้ การทดสอบพบว่าประโยคสั้นแนวนอนและข้อความรูปแบบหัวข้อมีอัตราความผิดพลาดใกล้ศูนย์ ย่อหน้าภาษาจีนยาวมีปัญหาเล็กน้อยเรื่องความหนาแน่นของเครื่องหมายวรรคตอนเท่านั้น
เทคนิคหลัก: ใช้เครื่องหมายอัญประกาศคู่ล้อมรอบข้อความที่ต้องการเรนเดอร์
ไม่ว่าจะเป็นภาษาจีนหรือภาษาอังกฤษ ข้อความเฉพาะใดๆ ที่ต้องการให้ปรากฏในภาพต้องอยู่ในเครื่องหมายอัญประกาศคู่ในพรอมต์ ตัวอย่างเช่น:
“ป้ายเขียนว่า ‘เปิดให้บริการ’” “เสื้อยืดหน้าอกมีข้อความว่า ‘สุขสัปดาห์ดี‘“
โหมดความคิด: สำหรับองค์ประกอบที่ซับซ้อน
สำหรับภาพที่มีหลายองค์ประกอบและต้องการความสัมพันธ์เชิงพื้นที่แม่นยำ โหมดปกติอาจลืมองค์ประกอบบางส่วน ต้องเปิด “โหมดความคิด”
คำถามที่พบบ่อย
ถาม: ผู้ใช้ฟรีและแบบจ่ายต่างกันมากไหม?
ผู้ใช้ฟรี: 2-3 ภาพต่อวัน ใช้ได้เฉพาะโหมดทันที เหมาะสำหรับลองใช้ ผู้ใช้แบบจ่าย (Plus, 20$ต่อเดือน): สามารถใช้โหมดความคิดได้
สรุป
GPT Image 2 คือเครื่องมือสร้างภาพ AI ที่ใกล้เคียงที่สุดกับ “พร้อมใช้งานจริงในการผลิต” ความก้าวหน้าด้านการเรนเดอร์ข้อความทำให้ฉากภาษาจีนเชื่อถือได้ในที่สุด
แนะนำให้เริ่มจากฉากง่ายๆ ก่อน คุ้นเคยกับขอบเขตความสามารถของโมเดล แล้วค่อยลององค์ประกอบที่ซับซ้อน