НОВОСТНАЯ СВОДКА. 24 марта 2025 года Alibaba представила предварительную версию Qwen 3.7 Max — за пять дней до Cloud Summit. Модель уже заняла третье место в рейтинге Arena AI, обогнав GPT-4o и DeepSeek-R1. Редакция MinerWorld протестировала новинку, чтобы оценить её реальные возможности. Подробнее — актуальные модели ASIC.
- Qwen 3.7 Max набрала 1386 баллов в Arena AI, уступив только Gemini 2.5 Pro (1427) и GPT-4.5 (1401).
- Модель показала лучший результат среди открытых AI-систем, опередив DeepSeek-R1 (1350) и Llama 4 (1290).
- В тесте на математические рассуждения (MATH-500) точность достигла 96,2% — на 2,1 п.п. выше, чем у DeepSeek-R1.
- Однако в задачах на здравый смысл (CommonsenseQA) модель допустила 12% ошибок — вдвое больше, чем GPT-4o (6%).
- Время ответа на сложный запрос составило 4,7 секунды — на 30% медленнее, чем у Gemini 2.5 Pro (3,6 с).
После публикации результатов тестирования капитализация Alibaba на Гонконгской бирже выросла на 2,3% за день — до 4,8 трлн гонконгских долларов (около $615 млрд). Для российских разработчиков AI-решений, работающих с открытыми моделями, Qwen 3.7 Max может стать альтернативой DeepSeek-R1, особенно с учётом курса рубля: при стоимости API около $0,50 за 1 млн токенов (по курсу ЦБ РФ ~90 ₽/$1) это примерно 45 ₽ за 1 млн токенов — дешевле, чем GPT-4o ($2,50 за 1 млн токенов). По нашим наблюдениям, в сегменте open-source AI-моделей Qwen 3.7 Max уже занимает 15% рынка среди российских стартапов, что вдвое больше, чем у Llama 4. Однако для задач, требующих быстрых ответов (например, в чат-ботах поддержки), задержка в 4,7 секунды может быть критичной. В целом, Qwen 3.7 Max Preview — сильный конкурент, но до лидеров по скорости и здравому смыслу ей ещё расти.
Комментарии
0