GPT Image GPT Image
ChatGPT Image 2 Посібник користувача
Посібник з інструментів AI

ChatGPT Image2 - Повний посібник з усіма можливостями

ChatGPT Image 2, найновіша модель генерації зображень від OpenAI, досягає якісних проривів у рендерингу тексту, контролі кількох елементів та узгодженості стилю. Ця стаття детально описує різні методи використання та техніки написання промптів для ChatGPT Image 2.

GPT-Image HK
Поділитися:

ChatGPT Image 2 тут.

21 квітня OpenAI тихо додав GPT Image 2 до ChatGPT та Codex без прес-конференції, без попереднього перегляду, просто відразу запустив. Протягом 12 годин він очолив рейтинг Image Arena з 1512 балами, випередивши друге місце на 242 бали — найбільша різниця балів в історії рейтингу.

Як людина, яка давно стежить за інструментами AI для зображень, цього разу я не розчарувався. Після тижня практичних тестів я склав набір ефективних методів використання, якими хочу поділитися з вами сьогодні.

ChatGPT Image 2 Посібник користувача

Перша річ: Де знаходиться точка входу?

Якщо ви хочете використовувати безпосередньо, найпростіший спосіб — через ChatGPT. Натисніть кнопку ”+” у полі введення та виберіть “Створити зображення”. Безкоштовні користувачі наразі отримують 2-3 зображення на день, тоді як користувачі Plus можуть використовувати потужніший “Режим мислення”.

Режим мислення займає більше часу, але забезпечує вищу точність тексту та більш складні можливості компонування. Якщо у вас є високі вимоги до згенерованих результатів, я рекомендую підписатися на Plus, щоб використовувати Режим мислення.

Формула промпту: Пишіть так і не помилитесь

Після тижня тестування я склав формулу промпту, специфічну для GPT Image 2:

**【Візуальний стиль】+【Фон сцени】+【Основний об’єкт】+【Конкретні деталі та текст】+【Макет та обмеження】】

Приклад успішного промпту для зображення продукту:

Фотографія продукту кінематографічної якості. Сцена на темно-сірий шорсткій кам’яній поверхні з темним фоном з невеликою кількістю диму. Об’єкт — квадратна чоловіча парфумова пляшка з чорного скла, злегка нахилена. Деталі: на передній частині пляшки парфуму золоті англійські літери “SERIAL” шрифтом без засічок, з реалістичними маленькими краплями води на поверхні пляшки. Обмеження: єдине джерело світла справа з жорстким освітленням, що відкидає чіткі контурні тіні, високий контраст та холодний тон, ніяких інших об’єктів, крім парфуму.

Суть цієї формули: спочатку встановіть тон стилю, потім опишіть сцену та об’єкт, використайте конкретні деталі для обмеження результатів, нарешті використайте умови виключення, щоб заблокувати те, що не повинно з’являтися.

Рендеринг тексту: Нарешті без помилок

У минулому, використовуючи AI-малювання, найбільше я боявся змусити його писати китайською. Або це були орфографічні помилки, або текст перетворювався на нерозбірливі символи.

GPT Image 2 по суті вирішив цю проблему в цьому поколінні. Практичні тести показують, що короткі горизонтальні речення та текст у стилі заголовка мають частоту помилок близьку до нуля, а довгі китайські абзаци лише іноді мають незначні проблеми з щільністю пунктуації.

Ключова техніка: Використовуйте лапки навколо тексту, який ви хочете рендерити.

Незалежно від того, китайська це чи англійська, будь-який конкретний текст, який ви хочете бачити на зображенні, має бути взятий у лапки у вашому промпті. Наприклад:

“Вивіска говорить ‘Відкрито для бізнесу’” “На передній частині футболки написано ‘Щасливих вихідних’”

У поєднанні з конкретними описоми позиції, як-от “по центру” або “верхній лівий кут”, точність рендерингу тексту покращиться ще більше.

Складна композиція: Використовуйте Режим мислення

Для зображень, що містять кілька елементів і потребують точних просторових відносин, звичайний режим може втратити деякі елементи. Тут вам потрібно увімкнути “Режим мислення”.

Часті запитання

З: Яка різниця між безкоштовною та платною версіями?

Безкоштовна версія: 2-3 зображення на день, лише миттєвий режим, підходить для ознайомлення. Платна версія (Plus, 20$/місяць): може використовувати Режим мислення, щоденні ліміти більш щедрі, підходить для користувачів з пакетними потребами.

Підсумок

GPT Image 2 наразі є інструментом AI для зображень, найближчим до “придатного для реального виробництва”. Прорив у рендерингу тексту нарешті робить китайські сцени надійними.

Почати використовувати GPT-image2

Поділитися: