Новая модель OpenAI невероятно мощная! Фотореалистичные изображения взрывают социальные сети
После появления GPT Image 2 сгенерированные ИИ изображения в китайском интернете уже могут сойти за настоящие. Эта статья исследует реальные случаи того, как визуальный ИИ добивается прорывов в повседневной жизни и социальных сценариях.
GPT Image 2 запущен, и битва окончена.
21 апреля OpenAI тихо выпустил GPT Image 2. Без пресс-конференции, без предварительного просмотра, просто сразу в ChatGPT и Codex. Через 12 часов он занял первое место в рейтинге Image Arena с 1512 очками, на 242 очка опередив второе место — это самый большой разрыв в истории рейтинга.
После использования этой модели в течение нескольких дней и генерации почти 100 изображений я могу подтвердить: это текущий лучший модель с точки зрения эстетики, отображения текста и производительности логики изображений.

Китайский интернет: можно принять за настоящее
Позвольте начать с самых интуитивных ощущений.
Я попросил GPT Image 2 сгенерировать изображение «красивая стримерша ведёт прямой эфир в Douyin» с невероятно простым промптом. Результат: естественная общая композиция, реалистичные черты стримерши, богатые элементы фона. Самое главное — китайские иероглифы в секции комментариев были полностью правильными — без опечаток, без искажений.
Затем я повысил сложность — воссоздал комнату прямого эфира красавицы в древнем стиле. В таком типе комнаты много украшений и сложных элементов, что с большей вероятностью выявляет проблемы. Производительность GPT Image 2 осталась стабильной: китайские иероглифы были правильными, стиль точно соответствовал реальным страницам.
Эстетика изображений также была на высоте. Наряд красавицы, окружение, освещение и гармония цветов создавали тёплое и элегантное ощущение.
Что делать, когда возникают мелкие проблемы? Просто отправьте их обратно в GPT Image 2 для корректировки, и он исправит всё сразу.
Скриншоты из WeChat Moments тоже
Помимо Douyin, GPT Image 2 также отлично воссоздаёт WeChat Moments.
Промпт: Создать скриншот Moments WeChat Илона Маска с комментарием «GPT Image 2 такой крутой» и другими лайками.
Сразу GPT Image 2 создал самый горячий скриншот обсуждения в технологическом круге за день. Если бы вам никто не сказал, что это сгенерировано ИИ, вы бы смогли это определить?
Дизайнерские постеры тоже работают хорошо
Использование GPT Image 2 для дизайна и рекламы тоже работает без проблем.
Согласно официальному описанию, Images 2.0 — первая модель изображений OpenAI с возможностью «мышления». Эта способность мышления делает её более стабильной при обработке сложных композиций и координации нескольких элементов.
Создание IP тоже стабильно. Будь то поддержание согласованности персонажей или генерация различных сцен и поз по требованию, GPT Image 2 может хорошо выполнять задачи.
Объективный взгляд на плюсы и минусы
После разговора о преимуществах, давайте также обсудим недостатки.
GPT Image 2 всё ещё не на 100% точен в обработке деталей изображения. Для сценариев, требующих сложного логического планирования, модель всё ещё имеет высокий уровень отказов. Например, контент, включающий точные вычисления, сложные пространственные макеты и многошаговое рассуждение, всё ещё не даёт идеальных результатов.
Кроме того, сложные движения рук (игра на пианино, вязание и т.д.), плотные толпы (более 15 человек) и промышленные чертежи, требующие строгой физической логики, всё ещё несут риск неудач с текущей моделью.
Доступно сейчас
GPT Image 2 теперь полностью запущен, и бесплатные пользователи тоже могут его использовать. Хотя есть ежедневный лимит квоты, его достаточно для пробы.
Если вы хотите более эффективный опыт — безлимитная квота, режим мышления, более высокое разрешение — вы можете подписаться на Plus членство (20$/месяц).
В заключение
Точка перегиба для визуального ИИ, возможно, действительно наступила.
После появления GPT Image 2 сгенерированные ИИ изображения в китайских интернет-сценариях уже могут сойти за настоящие. Будь то графика для социальных сетей, основные изображения для электронной коммерции, дизайн бренда или создание контента — этот инструмент показал удивительную практическую ценность.
Он не идеален, но это инструмент изображений ИИ, наиболее близкий к «пригодному для реального производства» в настоящее время.
Рекомендую начинать с простых сценариев, чтобы познакомиться с границами возможностей модели, прежде чем пытаться создавать сложные композиции. При возникновении проблем проводите несколько итераций — в большинстве случаев вы получите удовлетворительные результаты.