MIT MeMo: LLM-модели на 26% эффективнее без переобучения
Новый фреймворк MeMo от MIT позволяет менять LLM-модели без переобучения, повышая производительность на 26%.
Исследователи из MIT разработали фреймворк MeMo, который даёт командам возможность заменять большие языковые модели (LLM) без необходимости их переобучения. Это решение обещает повысить производительность на 26%, значительно упрощая работу с ИИ в корпоративной среде.
MeMo решает ключевые проблемы корпоративного ИИ, связанные с дороговизной, медлительностью и ограничениями контекстного окна при обучении новых LLM. Фреймворк кодирует новые знания в отдельный, меньший по размеру модуль, что позволяет избежать полного переобучения. Такая технология может значительно ускорить внедрение и обновление ИИ-систем, делая их более гибкими и экономичными.