Meta представила «гиперагентов»: самообучающийся ИИ без кода
Исследователи Meta представили концепцию «гиперагентов», призванных разблокировать самосовершенствующийся ИИ для задач, не требующих кодирования.
Исследователи из Meta и нескольких университетов представили «гиперагентов» — новую систему искусственного интеллекта, способную к непрерывному самосовершенствованию. Эта разработка позволяет ИИ самостоятельно переписывать и оптимизировать свою логику решения задач, а также базовый код. Гиперагенты могут работать в динамичных средах, где задачи не всегда предсказуемы, что особенно важно для корпоративных систем.
Существующие системы самосовершенствующегося ИИ сталкиваются с ограничениями, поскольку они полагаются на фиксированные, созданные вручную механизмы улучшения. Эти механизмы работают только в строгих условиях, например, в разработке программного обеспечения. Гиперагенты же способны самостоятельно изобретать общие возможности, такие как постоянная память и автоматическое отслеживание производительности, что расширяет их применение за пределы кодирования, включая робототехнику и анализ документов.
Основная проблема текущих систем самосовершенствования заключается в использовании фиксированного «мета-агента». Эта статическая система верхнего уровня, созданная для модификации базовой системы, требует постоянного вмешательства человека. Дженни Чжан, соавтор исследования, отмечает, что такие мета-агенты улучшаются только со скоростью, с которой люди могут их проектировать и поддерживать. Это создает «стену обслуживания», замедляя прогресс из-за зависимости от ручного труда.
Примером самореферентной системы является Darwin Gödel Machine (DGM) от Sakana AI, которая улучшается, переписывая собственный код. DGM показала, что открытое, рекурсивное самосовершенствование достижимо в кодировании. Однако DGM неэффективна вне разработки ПО, поскольку её оценка и самомодификация привязаны к задачам кодирования. Улучшение навыков кодирования не обязательно улучшает способность агента модифицировать своё поведение в не-кодовых областях, таких как математика или анализ текстов.
Чтобы преодолеть эти ограничения, исследователи предложили концепцию гиперагентов. В этой архитектуре агент — это любая вычислимая программа, способная вызывать большие языковые модели, внешние инструменты или обученные компоненты. Гиперагент объединяет «агента задачи» (выполняющего конкретную проблему) и «мета-агента» (анализирующего и модифицирующего агентов) в единую, самореферентную и редактируемую программу.
Поскольку вся программа может быть переписана, система способна модифицировать сам механизм самосовершенствования. Этот процесс исследователи назвали метакогнитивной самомодификацией. Дженни Чжан объясняет, что гиперагенты не просто учатся лучше решать задачи, но и учатся улучшать процесс обучения. Это приводит к накоплению знаний, позволяя им развиваться быстрее и переносить улучшения между задачами.
Исследователи расширили Darwin Gödel Machine, создав DGM-Hyperagents (DGM-H). Эта система сохраняет структуру открытого эволюционного поиска оригинальной DGM, предотвращая преждевременную конвергенцию. DGM-H постоянно создает новые варианты из архива успешных гиперагентов, позволяет им самомодифицироваться, оценивает их на задачах и добавляет успешные версии обратно в пул для будущих итераций. Такое сочетание эволюционного поиска и метакогнитивной самомодификации позволяет ИИ самосовершенствоваться в любой вычислимой задаче.
Гиперагенты прошли испытания на различных задачах. На бенчмарке Polyglot для кодирования они показали результаты, сопоставимые с DGM. В не-кодовых областях, таких как рецензирование научных статей, разработка моделей вознаграждения для робототехники и оценка олимпиадных задач по математике, гиперагенты превзошли открытые аналоги и разработанные человеком функции. Гиперагент, оптимизированный для рецензирования и робототехники, примененный к ранее неизвестной задаче по математике, достиг улучшения на 0.630 за 50 итераций, опередив даже специализированный ProofAutoGrader.
Эксперименты выявили интересные автономные поведения гиперагентов. Например, при оценке статей агент сначала использовал стандартные методы промпт-инжиниринга. Когда это оказалось ненадежным, он переписал свой код, чтобы создать многоступенчатый конвейер оценки с четкими контрольными списками и жесткими правилами принятия решений. Гиперагенты также самостоятельно разработали инструмент памяти, чтобы избегать прошлых ошибок, и написали трекер производительности для мониторинга архитектурных изменений. Система даже научилась учитывать бюджет вычислений, корректируя планирование: на ранних этапах она делала амбициозные изменения, а на поздних — консервативные, инкрементальные улучшения.
Для корпоративных команд данных Дженни Чжан рекомендует начинать с задач, успех которых однозначен и легко оценивается. Это открывает возможности для более глубокого анализа данных и быстрого создания функций. Для более сложных задач гиперагенты могут сначала разработать обученных судей, которые лучше отражают человеческие предпочтения. Код гиперагентов доступен под некоммерческой лицензией.
Внедрение гиперагентов несет и риски. Исследователи отмечают, что такие системы могут развиваться гораздо быстрее, чем люди способны их проверять. DGM-H был ограничен безопасными средами, чтобы предотвратить нежелательные побочные эффекты. Чжан советует разработчикам устанавливать ограничения на ресурсы и доступ к внешним системам во время фазы самомодификации. Важно разделять эксперименты и развертывание: агент исследует в контролируемой «песочнице», а изменения, влияющие на реальные системы, тщательно проверяются перед применением.
Еще одна опасность — «игровая оценка», когда ИИ улучшает свои метрики без реального прогресса в достижении цели. Гиперагенты, управляемые эмпирическими сигналами оценки, могут находить стратегии для эксплуатации слабых мест в процедуре оценки. Предотвратить это можно с помощью разнообразных, надежных и регулярно обновляемых протоколов оценки, а также постоянного человеческого надзора. В будущем роль инженеров изменится: они будут проектировать механизмы аудита и стресс-тестирования систем, а не писать логику улучшения. Задача сместится от создания систем к формированию их направления.