Почему чат-бот Grok от xAI не способен к самообучению на основе пользовательского фидбека, и как это связано с фундаментальными ограничениями генеративного ИИ? Илон Маск публично признал эту проблему, ответив «Good point» на замечание основателя Extropic Гийома Вердена.
Триггер события
Дискуссия началась после публикации Ричарда Саттона — лауреата премии Тьюринга 2024 года, профессора Университета Альберты и сотрудника канадского института ИИ Amii. Саттон выдвинул тезис: современный генеративный ИИ, обучающийся на фиксированных наборах данных, не способен к подлинным научным открытиям. Его аргументация строится на отсутствии механизма самостоятельной оценки результата — программа не может осознать, насколько удачным оказался её ответ в конкретный момент, а значит, лишена возможности отбирать лучшие решения. Подробнее — майнеры в наличии.
Верден перевёл теорию в практическую плоскость, затронув интересы Маска. Он предположил: если Саттон прав, то Grok мог бы стать идеальным инструментом для создания вирусного контента. Пользователи соцсетей оттачивают мастерство написания текстов именно через пробы и ошибки, где мерилом успеха служит отклик аудитории. У Илона Маска есть доступ к колоссальному массиву таких данных, но существует серьёзная преграда: Grok создаёт тексты, однако информация о том, какие из них стали популярными, не возвращается в систему для дообучения.
Сравнение с прошлыми кейсами 2020-2025
Проблема, на которую указал Верден, не нова. В 2022 году OpenAI столкнулась с аналогичным ограничением при обучении GPT-3.5: модель не учитывала реакцию пользователей на сгенерированные ответы, что привело к выпуску системы RLHF (обучение с подкреплением на основе человеческой обратной связи). Однако RLHF требует ручной разметки данных, что дорого и медленно. В отличие от этого, платформа X (бывший Twitter) генерирует миллионы реакций ежедневно — Маск владеет уникальным ресурсом, но не использует его.
В 2023 году Google столкнулась с критикой Bard за генерацию фактически неверных ответов, что также было связано с отсутствием механизма автоматической оценки качества. К 2024 году ни один крупный игрок (OpenAI, Google, Anthropic) не внедрил полноценную петлю обратной связи в реальном времени. По нашим наблюдениям, это системная проблема индустрии: текущие архитектуры LLM не предусматривают встроенного сбора метрик успешности генерации.
Цифры, которые меняют картину
Платформа X обрабатывает около 500 миллионов постов в день. Если бы Grok анализировал, какие из сгенерированных текстов получают больше лайков, репостов и комментариев, он мог бы дообучаться на ~10-50 миллионах примеров ежедневно — это на порядок больше, чем любой существующий датасет для RLHF. Для сравнения: датасет InstructGPT содержал около 30 тысяч примеров, а Anthropic использовала 100 тысяч. Потенциальный прирост качества при таком объёме данных может составить десятки процентов по метрикам точности и релевантности. Подробнее — гайд по выбору ASIC на 2026 год.
Для российских майнеров и инвесторов этот кейс важен с точки зрения энергопотребления. Обучение крупных моделей требует огромных вычислительных мощностей: например, обучение GPT-4 оценивается в 100 миллионов долларов только за электроэнергию. В России промышленные майнинг-площадки в Иркутской области и Красноярском крае платят за электроэнергию около 3-5 рублей за кВт·ч, что делает регион привлекательным для размещения ИИ-дата-центров. Однако текущее регулирование (ФЗ-259 «О цифровых финансовых активах») не охватывает майнинг ИИ, а лимиты Минэнерго по майнингу в южных регионах ограничивают рост. Если Маск решит строить кластеры для дообучения Grok в России, это может создать новый спрос на мощности и подстегнуть развитие хостинга в Сибири.
Что это меняет на горизонте 3-6 месяцев
Признание Маска — не просто формальность. Оно указывает на потенциальное изменение архитектуры Grok: внедрение петли обратной связи на основе данных X. Если xAI реализует эту идею, Grok может стать первым ИИ, который учится на реальных реакциях миллионов пользователей в реальном времени. Это даст ему конкурентное преимущество перед GPT-4 и Claude в задачах генерации контента, ориентированного на вирусность.
Для российского рынка это означает: во-первых, рост спроса на GPU-кластеры для дообучения моделей, что может увеличить загрузку майнинговых мощностей в регионах с дешёвой энергией. Во-вторых, появление новых инструментов для SMM и контент-маркетинга на базе Grok, которые будут учитывать локальные особенности аудитории. В-третьих, возможное ужесточение регулирования ИИ в РФ: если Grok начнёт обучаться на данных российских пользователей X, потребуется соответствие 152-ФЗ о персональных данных.
Вывод: Маск указал на архитектурный пробел, который может стать точкой роста для всей индустрии. Российским майнерам стоит следить за развитием событий — если xAI начнёт масштабное строительство дата-центров для дообучения, это создаст новый рынок сбыта мощностей, особенно в Сибири и на Дальнем Востоке.





Комментарии
0