Обученная ИИ-модель за $1500: Прорыв Sapient в LLM

Исследователи из Sapient обучили базовую модель ИИ всего за $1500, радикально снизив привычные миллионные затраты. Их решение — HRM-Text.

Схематичное изображение нейронной сети или архитектуры ИИ-модели HRM-Text

Исследователи из компании Sapient заявили, что им удалось обучить фундаментальную модель искусственного интеллекта с нуля, потратив на это всего около 1500 долларов. Это достижение серьёзно меняет представление о традиционно высоких затратах на разработку таких систем.

Обычно обучение базовых больших языковых моделей (LLM) требует миллионов долларов и огромных объемов данных. Для преодоления этих дорогостоящих подходов команда Sapient разработала архитектуру HRM-Text, которая приходит на смену стандартным Трансформерам и предлагает более эффективный путь к созданию мощных ИИ.