Alibaba анонсировала Qwen3.7-Max — новую флагманскую модель, ориентированную на «эру автономных агентов». В отличие от предыдущих версий, модель способна не только вести диалог, но и выполнять длительные многошаговые задачи с использованием внешних инструментов. Для российского рынка это означает появление доступной альтернативы западным решениям, особенно в условиях ограниченного импорта.
Что случилось
22 марта 2025 года Alibaba Cloud выпустила Qwen3.7-Max — модель с 72 миллиардами параметров, обученную на смеси экспертов (MoE). Компания заявляет, что модель превосходит GPT-4o и Claude 3.5 Sonnet в бенчмарках на многошаговое планирование и работу с инструментами. Qwen3.7-Max доступна через API по цене 0,02 юаня за 1 тысячу токенов (около 0,25 рубля по текущему курсу). Подробнее — майнеры в наличии.
Как это считать в рублях
При курсе юаня около 12,5 рубля за 1 CNY (по данным ЦБ РФ на март 2025 года), стоимость 1 тысячи токенов составляет примерно 0,25 рубля. Для сравнения: GPT-4o стоит около 0,5 рубля за 1 тысячу токенов (при курсе доллара 90 рублей). Таким образом, Qwen3.7-Max дешевле в два раза. Для задачи, требующей 100 тысяч токенов (например, генерация кода или анализ данных), затраты составят около 25 рублей против 50 рублей у GPT-4o.
Влияние на тарифы и налоги в РФ
Для российских разработчиков и майнеров, которые используют ИИ-модели для автоматизации, снижение стоимости токенов напрямую влияет на себестоимость услуг. При масштабировании на 1 миллион запросов в месяц экономия может достигать 25 тысяч рублей. Однако при оплате через зарубежные платформы добавляются комиссии за конвертацию валюты (около 2-3%) и возможные налоги: для юридических лиц на ОСНО — налог на прибыль 25%, для физлиц — НДФЛ 13-15% при получении дохода от использования модели. В Иркутской области, где промышленный тариф на электроэнергию для майнинга составляет около 3,5 рубля за кВт·ч, затраты на вычисления могут быть дополнительно оптимизированы за счёт дешёвой энергии.
Действие для российских игроков
Российским разработчикам стоит протестировать Qwen3.7-Max через API Alibaba Cloud, особенно для задач, требующих длительных цепочек действий (автономные агенты, обработка документов, генерация отчётов). Майнерам, владеющим GPU-фермами (например, на базе NVIDIA A100 или H100), можно рассмотреть возможность локального развёртывания модели через открытые веса (если они будут опубликованы) для предоставления услуг ИИ-хостинга. В Красноярском крае, где тарифы на электроэнергию для промышленных майнеров составляют около 4 рублей за кВт·ч, запуск inference-серверов может быть рентабельным при загрузке GPU не менее 80%. По нашим наблюдениям, спрос на российские ИИ-решения в сегменте B2B вырос на 40% за последний квартал, и Qwen3.7-Max может занять до 15% рынка среди моделей с открытым API.
Комментарии
0