ChatGPT Image2 - Повний посібник з усіма можливостями
ChatGPT Image 2, найновіша модель генерації зображень від OpenAI, досягає якісних проривів у рендерингу тексту, контролі кількох елементів та узгодженості стилю. Ця стаття детально описує різні методи використання та техніки написання промптів для ChatGPT Image 2.
ChatGPT Image 2 тут.
21 квітня OpenAI тихо додав GPT Image 2 до ChatGPT та Codex без прес-конференції, без попереднього перегляду, просто відразу запустив. Протягом 12 годин він очолив рейтинг Image Arena з 1512 балами, випередивши друге місце на 242 бали — найбільша різниця балів в історії рейтингу.
Як людина, яка давно стежить за інструментами AI для зображень, цього разу я не розчарувався. Після тижня практичних тестів я склав набір ефективних методів використання, якими хочу поділитися з вами сьогодні.

Перша річ: Де знаходиться точка входу?
Якщо ви хочете використовувати безпосередньо, найпростіший спосіб — через ChatGPT. Натисніть кнопку ”+” у полі введення та виберіть “Створити зображення”. Безкоштовні користувачі наразі отримують 2-3 зображення на день, тоді як користувачі Plus можуть використовувати потужніший “Режим мислення”.
Режим мислення займає більше часу, але забезпечує вищу точність тексту та більш складні можливості компонування. Якщо у вас є високі вимоги до згенерованих результатів, я рекомендую підписатися на Plus, щоб використовувати Режим мислення.
Формула промпту: Пишіть так і не помилитесь
Після тижня тестування я склав формулу промпту, специфічну для GPT Image 2:
**【Візуальний стиль】+【Фон сцени】+【Основний об’єкт】+【Конкретні деталі та текст】+【Макет та обмеження】】
Приклад успішного промпту для зображення продукту:
Фотографія продукту кінематографічної якості. Сцена на темно-сірий шорсткій кам’яній поверхні з темним фоном з невеликою кількістю диму. Об’єкт — квадратна чоловіча парфумова пляшка з чорного скла, злегка нахилена. Деталі: на передній частині пляшки парфуму золоті англійські літери “SERIAL” шрифтом без засічок, з реалістичними маленькими краплями води на поверхні пляшки. Обмеження: єдине джерело світла справа з жорстким освітленням, що відкидає чіткі контурні тіні, високий контраст та холодний тон, ніяких інших об’єктів, крім парфуму.
Суть цієї формули: спочатку встановіть тон стилю, потім опишіть сцену та об’єкт, використайте конкретні деталі для обмеження результатів, нарешті використайте умови виключення, щоб заблокувати те, що не повинно з’являтися.
Рендеринг тексту: Нарешті без помилок
У минулому, використовуючи AI-малювання, найбільше я боявся змусити його писати китайською. Або це були орфографічні помилки, або текст перетворювався на нерозбірливі символи.
GPT Image 2 по суті вирішив цю проблему в цьому поколінні. Практичні тести показують, що короткі горизонтальні речення та текст у стилі заголовка мають частоту помилок близьку до нуля, а довгі китайські абзаци лише іноді мають незначні проблеми з щільністю пунктуації.
Ключова техніка: Використовуйте лапки навколо тексту, який ви хочете рендерити.
Незалежно від того, китайська це чи англійська, будь-який конкретний текст, який ви хочете бачити на зображенні, має бути взятий у лапки у вашому промпті. Наприклад:
“Вивіска говорить ‘Відкрито для бізнесу’” “На передній частині футболки написано ‘Щасливих вихідних’”
У поєднанні з конкретними описоми позиції, як-от “по центру” або “верхній лівий кут”, точність рендерингу тексту покращиться ще більше.
Складна композиція: Використовуйте Режим мислення
Для зображень, що містять кілька елементів і потребують точних просторових відносин, звичайний режим може втратити деякі елементи. Тут вам потрібно увімкнути “Режим мислення”.
Часті запитання
З: Яка різниця між безкоштовною та платною версіями?
Безкоштовна версія: 2-3 зображення на день, лише миттєвий режим, підходить для ознайомлення. Платна версія (Plus, 20$/місяць): може використовувати Режим мислення, щоденні ліміти більш щедрі, підходить для користувачів з пакетними потребами.
Підсумок
GPT Image 2 наразі є інструментом AI для зображень, найближчим до “придатного для реального виробництва”. Прорив у рендерингу тексту нарешті робить китайські сцени надійними.