Компания OpenAI представила новую версию своего генератора изображений — ChatGPT Images 2.0. Разработчики позиционируют её как «передовую модель, способную решать сложные визуальные задачи и создавать точные, готовые к использованию работы». Ключевой особенностью новинки является функция «рассуждения» (thinking-level intelligence), которая позволяет ИИ анализировать запрос перед генерацией.
Согласно заявлению OpenAI, модель демонстрирует значительный прогресс в следовании инструкциям, точном расположении и соотношении объектов, а также в визуализации плотного текста. ChatGPT Images 2.0 уверенно работает с несколькими языками, самостоятельно заполняя пробелы в запросе на основе визуального и общего контекста. Это позволяет пользователям получать желаемый результат с меньшим количеством уточнений и итераций.
Улучшенная точность и контроль
ChatGPT Images 2.0 способен концептуализировать более сложные образы и эффективно воплощать их в жизнь. Модель точно следует инструкциям, сохраняет указанные детали и отображает мелкие элементы с разрешением до 2K. Это критически важно для профессиональных задач, где требуется высокая степень детализации и соответствия исходному замыслу. Например, при создании рекламных материалов или элементов пользовательского интерфейса.
Новая модель также значительно улучшила работу со стилями, точнее передавая характерные черты фотографий, кинематографических кадров, пиксельной графики, манги и других визуальных стилей. Интеграция с большой языковой моделью (LLM) обеспечивает высокую степень согласованности текстур, освещения, композиции и мелких деталей. Такая точность может быть весьма полезной в различных сферах, включая создание игровых прототипов, разработку сторибордов, подготовку маркетинговых материалов и создание произведений в определённом медиаформате или жанре.
«Мыслящий» ИИ и интеграция с ChatGPT
«Это позволяет модели взять на себя большую часть тяжелой работы между идеей и изображением, особенно когда точность, актуальность информации, согласованность и визуальная целостность имеют первостепенное значение», — утверждают в OpenAI.
ChatGPT Images 2.0 — это первая модель OpenAI для работы с изображениями, которая способна «рассуждать» перед генерацией. В связке с ChatGPT модель умеет искать информацию в интернете в реальном времени, создавать несколько вариантов по одному промпту, перепроверять результаты и даже генерировать рабочие QR-коды. Эта функция значительно расширяет возможности ИИ, превращая его из простого генератора в интеллектуального помощника для визуального контента.
Модель поддерживает различные соотношения сторон, от 3:1 по ширине до 1:3 по высоте, что даёт пользователям гибкость в создании изображений для разных платформ и целей. Доступ к ChatGPT Images 2.0 предоставляется пользователям ChatGPT и Codex. Функция Images with thinking доступна в рамках тарифных планов ChatGPT Plus, Pro и Business. Это событие происходит на фоне недавнего открытия OpenAI ограниченного доступа к новой ИИ-модели GPT-5.4-Cyber, что свидетельствует об активном развитии компании в области искусственного интеллекта.
Что это значит для рынка и пользователей из РФ/СНГ
Выпуск ChatGPT Images 2.0 от OpenAI является значимым шагом в развитии генеративного ИИ. Для пользователей из России и СНГ это означает доступ к более мощному и точному инструменту для создания визуального контента, который может быть использован в дизайне, маркетинге, разработке игр и других творческих областях. Улучшенное понимание запросов и способность к «рассуждению» сократят время на итерации и повысят качество конечного продукта. Однако доступность будет зависеть от региональных ограничений и способов оплаты подписок OpenAI.
Для майнеров криптовалют, особенно тех, кто работает с GPU-майнингом, развитие таких моделей, как ChatGPT Images 2.0, может косвенно влиять на рынок видеокарт. Повышенный спрос на вычислительные мощности для обучения и работы сложных ИИ-моделей может привести к росту цен на высокопроизводительные GPU, что, в свою очередь, может повлиять на рентабельность майнинга. В долгосрочной перспективе, развитие ИИ может также создать новые возможности для использования вычислительных ресурсов, помимо традиционного майнинга.
Комментарии
0