ChatGPT Image2 - دليل كامل لجميع القدرات
يحقق ChatGPT Image 2، أحدث نموذج لإنشاء الصور من OpenAI، قفزات نوعية في عرض النص والتحكم في العناصر المتعددة واتساق النمط. تتناول هذه المقالة تقنيات الاستخدام المختلفة وطرق كتابة الأوامر لـ ChatGPT Image 2.
ChatGPT Image 2 قد وصل.
في 21 أبريل، أضاف OpenAI بصمت GPT Image 2 إلى ChatGPT وCodex بدون مؤتمر صحفي، بدون معاينة، فقط تم الإطلاق مباشرة. في غضون 12 ساعة، تصدر ترتيب Image Arena بـ 1512 نقطة، متقدماً على المركز الثاني بـ 242 نقطة - 这是该榜有史以来最大分差。
بصفتي شخصاً يتابع أدوات صور الذكاء الاصطناعي منذ فترة طويلة، لم أكن بخيبة أمل هذه المرة. بعد أسبوع من الاختبارات العملية، جمعت مجموعة من طرق الاستخدام الفعالة لمشاركتها معكم اليوم.

الشيء الأول: أين نقطة الدخول؟
إذا كنت ترغب في استخدامه مباشرة، فإن الطريقة الأسهل هي من خلال ChatGPT. انقر على زر ”+” في مربع الإدخال واختر “إنشاء صورة”. يحصل المستخدمون المجانيون حالياً على حصة 2-3 صور يومياً، بينما يمكن لمستخدمي Plus استخدام “وضع التفكير” الأقوى.
وضع التفكير يستغرق وقتاً أطول لكنه يوفر دقة نص أعلى وقدرات تركيب أكثر تعقيداً. إذا كانت لديك متطلبات عالية للنتائج المولدة، أوصي بالاشتراك في Plus لاستخدام وضع التفكير.
صيغة الأمر: اكتب بهذه الطريقة ولن تفشل
بعد أسبوع من الاختبار، تلخيص صيغة أمر محددة لـ GPT Image 2:
【النمط البصري】+【خلفية المشهد】+【الموضوع الرئيسي】+【التفاصيل الدقيقة والنص】+【التخطيط والقيود】
مثال على أمر صورة منتج ناجح:
تصوير منتج بجودة سينمائية. مشهد على سطح حجري رمادي داكن خشن مع خلفية داكنة مع القليل من الدخان. الموضوع هو زجاجة عطر رجالية من الزجاج الأسود المربع، موضوعة بشكل ميل طفيف. التفاصيل: الجزء الأمامي من زجاجة العطر يحتوي على أحرف إنجليزية ذهبية “SERIAL” بخط sans-serif، مع قطرات ماء صغيرة واقعية على سطح الزجاجة. القيود: مصدر ضوء واحد على اليمين مع إضاءة صلبة، مما يلقي ظلالاً واضحة المعالم، تباين عالٍ ونبرة باردة، لا توجد أجسام أخرى غير العطر.
جوهر هذه الصيغة: حدد نبرة النمط أولاً، ثمصف المشهد والموضوع، ثم استخدم التفاصيل المحددة لتقييد النتائج، وأخيراً استخدم شروط الاستبعاد لقفل ما لا يجب أن يظهر.
عرض النص: أخيراً لا توجد إخفاقات
في الماضي، عند استخدام الرسم بالذكاء الاصطناعي، كان ما أخشاه أكثر هو جعله يكتب الصينية. إما أن تكون هناك أخطاء إملائية، أو يتحول النص إلى أحرف غير مقروءة.
أساساً حل GPT Image 2 هذه المشكلة في هذا الجيل. أظهرت الاختبارات العملية أن الجمل القصيرة الأفقية ونص أسلوب العنوان لهما معدل خطأ قريب من الصفر، والفقرات الصينية الطويلة لها فقط مشاكل صغيرة أحياناً مع كثافة الترقيم.
ال technique clé: استخدم علامات الاقتباس المزدوجة حول النص الذي ترغب في عرضه.
سواء كانت صينية أو إنجليزية، يجب وضع أي نص محدد ترغب في ظهوره في الصورة بين علامات اقتباس مزدوجة في الأمر. على سبيل المثال:
“اللوحة تقول ’ مفتوح للأعمال’” “مقدمة القميص تقول ‘نهاية أسبوع سعيدة‘“
التكوين المعقد: استخدم وضع التفكير
للصور التي تحتوي على عناصر متعددة وتتطلب علاقات مكانية دقيقة، يميل الوضع العادي إلى إغفال بعض العناصر. هنا تحتاج إلى تمكين “وضع التفكير”.
الأسئلة الشائعة
س: ما مدى حجم الفرق بين الإصدارات المجانية والمدفوعة؟
الإصدار المجاني: 2-3 صور يومياً، وضع فوري فقط، مناسب للتجربة. الإصدار المدفوع (Plus، 20 دولاراً/شهر): يمكنه استخدام وضع التفكير، والحصص اليومية أكثر سخاءً، مناسب للمستخدمين الذين لديهم احتياجات دفعية.
ملخص
GPT Image 2 هو حالياً أداة صور الذكاء الاصطناعي الأقرب إلى “قابلة للاستخدام في الإنتاج الفعلي”. الاختراق في عرض النص يجعل المشاهد الصينية أخيراً جديرة بالثقة.