Новая модель OpenAI невероятно мощная! Фотореалистичные изображения взрывают социальные сети

GPT Image 2 запущен, и битва окончена.

21 апреля OpenAI тихо выпустил GPT Image 2. Без пресс-конференции, без предварительного просмотра, просто сразу в ChatGPT и Codex. Через 12 часов он занял первое место в рейтинге Image Arena с 1512 очками, на 242 очка опередив второе место — это самый большой разрыв в истории рейтинга.

После использования этой модели в течение нескольких дней и генерации почти 100 изображений я могу подтвердить: это текущий лучший модель с точки зрения эстетики, отображения текста и производительности логики изображений.

GPT Image 2 Фотореалистичное отображение изображений

Китайский интернет: можно принять за настоящее

Позвольте начать с самых интуитивных ощущений.

Я попросил GPT Image 2 сгенерировать изображение «красивая стримерша ведёт прямой эфир в Douyin» с невероятно простым промптом. Результат: естественная общая композиция, реалистичные черты стримерши, богатые элементы фона. Самое главное — китайские иероглифы в секции комментариев были полностью правильными — без опечаток, без искажений.

Затем я повысил сложность — воссоздал комнату прямого эфира красавицы в древнем стиле. В таком типе комнаты много украшений и сложных элементов, что с большей вероятностью выявляет проблемы. Производительность GPT Image 2 осталась стабильной: китайские иероглифы были правильными, стиль точно соответствовал реальным страницам.

Эстетика изображений также была на высоте. Наряд красавицы, окружение, освещение и гармония цветов создавали тёплое и элегантное ощущение.

Что делать, когда возникают мелкие проблемы? Просто отправьте их обратно в GPT Image 2 для корректировки, и он исправит всё сразу.

Скриншоты из WeChat Moments тоже

Помимо Douyin, GPT Image 2 также отлично воссоздаёт WeChat Moments.

Промпт: Создать скриншот Moments WeChat Илона Маска с комментарием «GPT Image 2 такой крутой» и другими лайками.

Сразу GPT Image 2 создал самый горячий скриншот обсуждения в технологическом круге за день. Если бы вам никто не сказал, что это сгенерировано ИИ, вы бы смогли это определить?

Дизайнерские постеры тоже работают хорошо

Использование GPT Image 2 для дизайна и рекламы тоже работает без проблем.

Согласно официальному описанию, Images 2.0 — первая модель изображений OpenAI с возможностью «мышления». Эта способность мышления делает её более стабильной при обработке сложных композиций и координации нескольких элементов.

Создание IP тоже стабильно. Будь то поддержание согласованности персонажей или генерация различных сцен и поз по требованию, GPT Image 2 может хорошо выполнять задачи.

Объективный взгляд на плюсы и минусы

После разговора о преимуществах, давайте также обсудим недостатки.

GPT Image 2 всё ещё не на 100% точен в обработке деталей изображения. Для сценариев, требующих сложного логического планирования, модель всё ещё имеет высокий уровень отказов. Например, контент, включающий точные вычисления, сложные пространственные макеты и многошаговое рассуждение, всё ещё не даёт идеальных результатов.

Кроме того, сложные движения рук (игра на пианино, вязание и т.д.), плотные толпы (более 15 человек) и промышленные чертежи, требующие строгой физической логики, всё ещё несут риск неудач с текущей моделью.

Доступно сейчас

GPT Image 2 теперь полностью запущен, и бесплатные пользователи тоже могут его использовать. Хотя есть ежедневный лимит квоты, его достаточно для пробы.

Если вы хотите более эффективный опыт — безлимитная квота, режим мышления, более высокое разрешение — вы можете подписаться на Plus членство (20$/месяц).

В заключение

Точка перегиба для визуального ИИ, возможно, действительно наступила.

После появления GPT Image 2 сгенерированные ИИ изображения в китайских интернет-сценариях уже могут сойти за настоящие. Будь то графика для социальных сетей, основные изображения для электронной коммерции, дизайн бренда или создание контента — этот инструмент показал удивительную практическую ценность.

Он не идеален, но это инструмент изображений ИИ, наиболее близкий к «пригодному для реального производства» в настоящее время.

Рекомендую начинать с простых сценариев, чтобы познакомиться с границами возможностей модели, прежде чем пытаться создавать сложные композиции. При возникновении проблем проводите несколько итераций — в большинстве случаев вы получите удовлетворительные результаты.

Начать использовать GPT-image2