Microsoft Research представила семейство AI-агентов Fara1.5 с открытыми весами, которые на 15% точнее выполняют задачи в браузере, чем коммерческие аналоги от OpenAI и Google. На бенчмарке WebArena — одном из самых сложных тестов для live-веб-навигации — Fara1.5 показал результат 54,3% успешных завершений, тогда как OpenAI Operator достиг 38,1%, а Gemini 2.5 Computer Use — 44,8%.
Кто это
Fara1.5 — это семейство моделей, разработанное исследовательским подразделением Microsoft. В отличие от проприетарных решений, веса моделей опубликованы в открытом доступе, что позволяет любому разработчику дообучать и адаптировать их под свои задачи. В основе Fara1.5 лежит архитектура, оптимизированная для понимания веб-интерфейсов и выполнения многошаговых действий: от заполнения форм до навигации по многостраничным сайтам. Подробнее — каталог ASIC-майнеров.
Что они сделали и зачем
Исследователи Microsoft обучили Fara1.5 на синтетических данных, сгенерированных более крупными языковыми моделями. Агент способен анализировать скриншоты страниц и выполнять действия, имитируя поведение человека. В тестах Fara1.5 справлялся с задачами, которые требовали до 10 последовательных шагов — например, бронирование билетов или поиск товаров с заданными характеристиками. По нашим наблюдениям, открытая модель с таким уровнем производительности может ускорить внедрение AI-агентов в малом и среднем бизнесе, где затраты на проприетарные API часто становятся барьером.
Реакция конкурентов
OpenAI и Google пока не комментировали результаты Fara1.5. Однако оба вендора активно развивают собственные агенты: Operator от OpenAI доступен в ограниченном бета-тесте, а Gemini Computer Use интегрирован в ряд корпоративных продуктов Google Cloud. Открытый подход Microsoft может изменить расстановку сил: если сообщество адаптирует Fara1.5 под конкретные сценарии, коммерческим решениям придётся конкурировать с бесплатной альтернативой.
Финансовые последствия
Для российских разработчиков и интеграторов AI-решений появление Fara1.5 снижает порог входа. При курсе ЦБ РФ около 95 ₽ за $1 стоимость API OpenAI Operator составляет примерно $0,03 за запрос, что при массовом использовании даёт заметную нагрузку на бюджет. Открытая модель позволяет развернуть агента на собственном оборудовании, например, на площадках в Иркутской области, где промышленный тариф на электроэнергию составляет около 3,5 ₽/кВт·ч. Это делает эксплуатацию AI-агентов экономически оправданной для российских компаний, особенно в условиях регулирования ФЗ-259, которое не ограничивает использование открытых моделей.
Комментарии
0