Harness-1: новый ИИ-агент превзошел GPT-5.4 в поиске

Исследователи создали открытый ИИ-агент Harness-1, который показал лучшие результаты, чем GPT-5.4, в поиске релевантной информации.

Визуализация работы ИИ-агента Harness-1, обрабатывающего информацию

Исследователи из Университета Иллинойса в Урбане-Шампейне (UIUC), Калифорнийского университета в Беркли и платформы Chroma представили Harness-1. Это открытый поисковый агент с 20 миллиардами параметров, созданный на базе модели gpt-oss-20B от OpenAI. Он меняет подход ИИ к сложным задачам поиска.

Harness-1 значительно улучшает производительность, достигая 73% точности в извлечении релевантной информации из специально подобранного набора данных. Он превосходит GPT-5.4, у которого 70.9%, и Tongyi DeepResearch 30B на 11.4 процентных пункта. Модель и её окружение доступны под лицензией Apache 2.0, а код и веса можно найти на Hugging Face.

Существующие поисковые агенты часто страдают от «поисковой амнезии». Они забывают исходные запросы, зацикливаются на отклоненных документах или теряют нить проверки. Обычно это решают, заставляя модели постоянно перечитывать растущий транскрипт своих действий, что перегружает их рабочую память.

Harness-1 решает эту проблему, вынося «бухгалтерию» поисковой сессии из рабочей памяти модели во внешнюю структурированную среду. Эту среду исследователи называют «state-externalizing harness». Она управляет рабочим состоянием, включая пул документов, помеченные доказательства и записи проверки. Это позволяет ИИ сосредоточиться на семантических решениях, а не на управлении состоянием.

Обучение Harness-1 демонстрирует высокую эффективность данных. Модель обучалась на 899 траекториях тонкой настройки с учителем (SFT) и 3453 запросах обучения с подкреплением (RL). Это значительно меньше данных, чем у конкурирующих моделей, таких как Context-1 (17200 элементов) и Search-R1 (221300 элементов). Такой подход показывает, что умная внешняя архитектура может заменить масштабирование данных методом «грубой силы».

Для бизнеса Harness-1 предлагает значительные преимущества. Он выполняет многошаговый поиск по проприетарным базам данных без галлюцинаций и высоких затрат. Модель обеспечивает высокую производительность при затратах и задержке, сравнимых с Context-1, благодаря эффективному управлению контекстным окном.

Лицензия Apache 2.0 делает Harness-1 привлекательным для коммерческого использования. Она позволяет свободно интегрировать, изменять и монетизировать технологию без ограничений, присущих «copyleft» лицензиям. Это делает Harness-1 надёжным фундаментом для корпоративных решений.

Сообщество разработчиков позитивно отреагировало на анонс. Это подтверждает актуальность проблемы управления контекстом в агентских системах. Разработчики теперь больше интересуются эффективностью управления контекстом средой ИИ, чем размером окна контекста самой модели.