LIVE

OpenAI представила ChatGPT Images 2.0: «думающий» генератор изображений

OpenAI выпустила ChatGPT Images 2.0 — продвинутую модель для генерации изображений, способную к «рассуждению» перед созданием визуала. Она предлагает улучшенную точность, детализацию и понимание сложных запросов, а также интеграцию с ChatGPT для поиска информации и создания QR-кодов.

OpenAI представила ChatGPT Images 2.0: «думающий» генератор изображений

Компания OpenAI представила новую версию своего генератора изображений — ChatGPT Images 2.0. Разработчики позиционируют её как «передовую модель, способную решать сложные визуальные задачи и создавать точные, готовые к использованию работы». Ключевой особенностью новинки является функция «рассуждения» (thinking-level intelligence), которая позволяет ИИ анализировать запрос перед генерацией.

Согласно заявлению OpenAI, модель демонстрирует значительный прогресс в следовании инструкциям, точном расположении и соотношении объектов, а также в визуализации плотного текста. ChatGPT Images 2.0 уверенно работает с несколькими языками, самостоятельно заполняя пробелы в запросе на основе визуального и общего контекста. Это позволяет пользователям получать желаемый результат с меньшим количеством уточнений и итераций.

Улучшенная точность и контроль

ChatGPT Images 2.0 способен концептуализировать более сложные образы и эффективно воплощать их в жизнь. Модель точно следует инструкциям, сохраняет указанные детали и отображает мелкие элементы с разрешением до 2K. Это критически важно для профессиональных задач, где требуется высокая степень детализации и соответствия исходному замыслу. Например, при создании рекламных материалов или элементов пользовательского интерфейса.

Новая модель также значительно улучшила работу со стилями, точнее передавая характерные черты фотографий, кинематографических кадров, пиксельной графики, манги и других визуальных стилей. Интеграция с большой языковой моделью (LLM) обеспечивает высокую степень согласованности текстур, освещения, композиции и мелких деталей. Такая точность может быть весьма полезной в различных сферах, включая создание игровых прототипов, разработку сторибордов, подготовку маркетинговых материалов и создание произведений в определённом медиаформате или жанре.

«Мыслящий» ИИ и интеграция с ChatGPT

«Это позволяет модели взять на себя большую часть тяжелой работы между идеей и изображением, особенно когда точность, актуальность информации, согласованность и визуальная целостность имеют первостепенное значение», — утверждают в OpenAI.

ChatGPT Images 2.0 — это первая модель OpenAI для работы с изображениями, которая способна «рассуждать» перед генерацией. В связке с ChatGPT модель умеет искать информацию в интернете в реальном времени, создавать несколько вариантов по одному промпту, перепроверять результаты и даже генерировать рабочие QR-коды. Эта функция значительно расширяет возможности ИИ, превращая его из простого генератора в интеллектуального помощника для визуального контента.

Модель поддерживает различные соотношения сторон, от 3:1 по ширине до 1:3 по высоте, что даёт пользователям гибкость в создании изображений для разных платформ и целей. Доступ к ChatGPT Images 2.0 предоставляется пользователям ChatGPT и Codex. Функция Images with thinking доступна в рамках тарифных планов ChatGPT Plus, Pro и Business. Это событие происходит на фоне недавнего открытия OpenAI ограниченного доступа к новой ИИ-модели GPT-5.4-Cyber, что свидетельствует об активном развитии компании в области искусственного интеллекта.

Что это значит для рынка и пользователей из РФ/СНГ

Выпуск ChatGPT Images 2.0 от OpenAI является значимым шагом в развитии генеративного ИИ. Для пользователей из России и СНГ это означает доступ к более мощному и точному инструменту для создания визуального контента, который может быть использован в дизайне, маркетинге, разработке игр и других творческих областях. Улучшенное понимание запросов и способность к «рассуждению» сократят время на итерации и повысят качество конечного продукта. Однако доступность будет зависеть от региональных ограничений и способов оплаты подписок OpenAI.

Для майнеров криптовалют, особенно тех, кто работает с GPU-майнингом, развитие таких моделей, как ChatGPT Images 2.0, может косвенно влиять на рынок видеокарт. Повышенный спрос на вычислительные мощности для обучения и работы сложных ИИ-моделей может привести к росту цен на высокопроизводительные GPU, что, в свою очередь, может повлиять на рентабельность майнинга. В долгосрочной перспективе, развитие ИИ может также создать новые возможности для использования вычислительных ресурсов, помимо традиционного майнинга.

Частые вопросы

Что нового в ChatGPT Images 2.0?
Ключевая новинка — функция «рассуждения» перед генерацией, улучшенная точность в следовании инструкциям, детализация до 2K, а также способность работать с несколькими языками и самостоятельно заполнять пробелы в запросах. Модель также интегрирована с ChatGPT для поиска информации и генерации QR-кодов.
Почему функция «рассуждения» важна?
Функция «рассуждения» позволяет модели анализировать запрос и контекст перед созданием изображения, что значительно повышает точность, актуальность и согласованность результата. Это сокращает количество итераций и улучшает качество конечного продукта, особенно для сложных визуальных задач.
Как это может повлиять на майнеров?
Развитие таких мощных ИИ-моделей увеличивает спрос на высокопроизводительные GPU для обучения и работы, что потенциально может повлиять на цены видеокарт. Это может косвенно повлиять на рентабельность GPU-майнинга, а также создать новые возможности для использования вычислительных мощностей в будущем.

Комментарии

0
    Станьте первым, кто прокомментирует эту новость.