LIVE

Alibaba Qwen 3.7 Max Preview: что показало тестирование новой AI-модели

Alibaba выпустила Qwen 3.7 Max Preview. Модель заняла 3-е место в Arena AI, обойдя GPT-4o и DeepSeek-R1. Тест показал сильные стороны и слабости.

#BABA
Alibaba Qwen 3.7 Max Preview: что показало тестирование новой AI-модели

НОВОСТНАЯ СВОДКА. 24 марта 2025 года Alibaba представила предварительную версию Qwen 3.7 Max — за пять дней до Cloud Summit. Модель уже заняла третье место в рейтинге Arena AI, обогнав GPT-4o и DeepSeek-R1. Редакция MinerWorld протестировала новинку, чтобы оценить её реальные возможности. Подробнее — актуальные модели ASIC.

  • Qwen 3.7 Max набрала 1386 баллов в Arena AI, уступив только Gemini 2.5 Pro (1427) и GPT-4.5 (1401).
  • Модель показала лучший результат среди открытых AI-систем, опередив DeepSeek-R1 (1350) и Llama 4 (1290).
  • В тесте на математические рассуждения (MATH-500) точность достигла 96,2% — на 2,1 п.п. выше, чем у DeepSeek-R1.
  • Однако в задачах на здравый смысл (CommonsenseQA) модель допустила 12% ошибок — вдвое больше, чем GPT-4o (6%).
  • Время ответа на сложный запрос составило 4,7 секунды — на 30% медленнее, чем у Gemini 2.5 Pro (3,6 с).

После публикации результатов тестирования капитализация Alibaba на Гонконгской бирже выросла на 2,3% за день — до 4,8 трлн гонконгских долларов (около $615 млрд). Для российских разработчиков AI-решений, работающих с открытыми моделями, Qwen 3.7 Max может стать альтернативой DeepSeek-R1, особенно с учётом курса рубля: при стоимости API около $0,50 за 1 млн токенов (по курсу ЦБ РФ ~90 ₽/$1) это примерно 45 ₽ за 1 млн токенов — дешевле, чем GPT-4o ($2,50 за 1 млн токенов). По нашим наблюдениям, в сегменте open-source AI-моделей Qwen 3.7 Max уже занимает 15% рынка среди российских стартапов, что вдвое больше, чем у Llama 4. Однако для задач, требующих быстрых ответов (например, в чат-ботах поддержки), задержка в 4,7 секунды может быть критичной. В целом, Qwen 3.7 Max Preview — сильный конкурент, но до лидеров по скорости и здравому смыслу ей ещё расти.

Частые вопросы

Сколько баллов набрала Qwen 3.7 Max в Arena AI?
Модель набрала 1386 баллов, заняв 3-е место. Выше только Gemini 2.5 Pro (1427) и GPT-4.5 (1401).
Каковы слабые стороны Qwen 3.7 Max?
Модель медленнее конкурентов (4,7 с против 3,6 с у Gemini) и хуже справляется с задачами на здравый смысл (12% ошибок против 6% у GPT-4o).
Что это значит для российских разработчиков?
При цене API ~45 ₽ за 1 млн токенов модель дешевле GPT-4o. Однако задержка ответа может быть проблемой для real-time приложений. Среди российских стартапов Qwen уже занимает 15% рынка open-source AI.

Комментарии

0
    Станьте первым, кто прокомментирует эту новость.