Meituan открыла код LongCat-2.0: AI-модель для кодинга

30 июня 2026 г.

Китайская Meituan представила LongCat-2.0 – 1.6-триллионную AI-модель для кодирования, обученную на китайских чипах.

Meituan LongCat-2.0: AI-модель для кодирования на китайских чипах

Китайская компания Meituan, известная своим приложением для доставки, представила свою новую ИИ-модель LongCat-2.0. Анонс состоялся 30 июня 2026 года в 08:39 по московскому времени на платформах GitHub, Hugging Face и собственной площадке компании. Эта модель, ранее известная как анонимный проект «Owl Alpha», два месяца лидировала в глобальных чартах разработчиков на OpenRouter, демонстрируя впечатляющие возможности.

LongCat-2.0 — это система Mixture-of-Experts (MoE) с 1,6 триллионами параметров, разработанная для изменения рынка автономной разработки программного обеспечения. Модель предлагает нативное контекстное окно в 1 миллион токенов и распространяется под очень гибкой лицензией MIT, что делает её коммерчески привлекательной. Важная особенность: модель обучена на более чем 50 000 китайских специализированных интегральных схемах (ASIC), что демонстрирует независимость от американских графических процессоров Nvidia, доминирующих в обучении ИИ.

Meituan предлагает агрессивную ценовую политику. Обработка кэшированных контекстных запросов полностью бесплатна. Также доступны временные «пакеты токенов» по акции. Стандартная оплата по мере использования для некэшированных запросов составляет $0.75 за миллион входных токенов и $2.95 за миллион выходных токенов. Однако сейчас действует акционная цена: $0.30 за миллион входных токенов и $1.20 за миллион выходных токенов, что делает LongCat-2.0 одной из самых доступных моделей на рынке.

Сравнение цен на миллион токенов (вход/выход/общая стоимость):

MiMo-V2.5 Flash: $0.10 / $0.30 / $0.40
deepseek-v4-flash: $0.14 / $0.28 / $0.42
deepseek-v4-pro: $0.435 / $0.87 / $1.305
MiniMax-M3: $0.30 / $1.20 / $1.50
LongCat-2.0 (акция): $0.30 / $1.20 / $1.50
Gemini 3.1 Flash-Lite: $0.25 / $1.50 / $1.75
Qwen3.7-Plus: $0.40 / $1.60 / $2.00
MiMo-V2.5: $0.40 / $2.00 / $2.40
LongCat-2.0 (стандарт): $0.75 / $2.95 / $3.70
Grok 4.3 (низкий контекст): $1.25 / $2.50 / $3.75
MiMo-V2.5 Pro (≤256K): $1.00 / $3.00 / $4.00
Kimi-K2.6: $0.95 / $4.00 / $4.95
GLM-5.2: $1.40 / $4.40 / $5.80
GPT-5.6 Luna: $1.00 / $6.00 / $7.00
Grok 4.3 (высокий контекст): $2.50 / $5.00 / $7.50
MiMo-V2.5 Pro (>256K): $2.00 / $6.00 / $8.00
Qwen3.7-Max: $2.50 / $7.50 / $10.00
Gemini 3.5 Flash: $1.50 / $9.00 / $10.50
Gemini 3.1 Pro Preview (≤200K): $2.00 / $12.00 / $14.00
GPT-5.6 Terra: $2.50 / $15.00 / $17.50
GPT-5.4: $2.50 / $15.00 / $17.50
Gemini 3.1 Pro Preview (>200K): $4.00 / $18.00 / $22.00
Claude Opus 4.8: $5.00 / $25.00 / $30.00
GPT-5.5: $5.00 / $30.00 / $35.00
GPT-5.5 Instant (chat-latest): $5.00 / $30.00 / $35.00
Sakana Fugu Ultra (≤272K): $5.00 / $30.00 / $35.00
GPT-5.6 Sol: $5.00 / $30.00 / $35.00
Claude Fable 5 / Claude Mythos 5: $10.00 / $50.00 / $60.00

LongCat-2.0 оптимизирует разреженность MoE, масштабируя общее количество параметров до 1,6 триллиона, но ограничивая активные вычисления в среднем до 48 миллиардов параметров на токен. Это достигается за счёт фреймворка «Zero-Compute Experts», который направляет рутинные операции через более лёгкие подсети, устраняя избыточные вычислительные затраты. Для поддержания контекстного окна в 1 миллион токенов без аппаратных ограничений Meituan внедрила LongCat Sparse Attention (LSA), которая решает проблемы квадратичных затрат на оценку и фрагментации памяти.

LSA использует три метода: Streaming-aware Indexing (SI) для оптимизации чтения данных, Cross-Layer Indexing (CLI) для распределения вычислений между слоями и Hierarchical Indexing (HI) для двухэтапной оценки токенов. Кроме того, модель включает модуль N-gram Embedding, расширяющий пространство встраивания в 100 раз. Это позволяет LongCat-2.0 лучше улавливать локальные связи между токенами и ускорять пакетные операции.

Модель LongCat-2.0 ориентирована на многоэтапные инженерные задачи, интеграцию инструментов и автоматизированное управление репозиториями. В тестах SWE-bench Pro она набрала 59.5 баллов, превзойдя GPT-5.5 (58.6). Также модель показала 70.8 на Terminal-Bench 2.1, 77.3 на SWE-bench Multilingual и 73.2 на симуляторе корпоративных рабочих процессов FORTE. Эти результаты подтверждают её специализацию в области программной инженерии.

Такое поведение достигается благодаря пост-тренировочному слою MOPD (Multi-Teacher Optimization via Mixture of Specialized Experts). Он разделяет оптимизацию на три независимых кластера экспертов: Agent Experts для выполнения задач и работы с инструментами, Reasoning Experts для логики и решения сложных проблем, а также Interaction Experts для взаимодействия с пользователем, предотвращения галлюцинаций и соблюдения правил безопасности. Динамический механизм маршрутизации объединяет эти специализации во время работы модели.

Meituan, основанная в марте 2010 года Ван Сином, прошла путь от сайта ежедневных скидок до доминирующего «суперприложения» в Китае. После слияния с Dianping в 2015 году компания стала лидером в сфере доставки, обзоров, бронирования отелей и других услуг. Столкнувшись с жёсткой конкуренцией и снижением прибыли, Meituan направила миллиарды инвестиций в ИИ и разработку собственных чипов. Выпуск LongCat-Flash в конце 2025 года и последующих моделей показал амбиции компании стать ключевым игроком в глобальной инфраструктуре ИИ.

Для компаний LongCat-2.0 открывает новые возможности в разработке ПО и системных операциях. Модель с открытым исходным кодом, лицензией MIT и контекстным окном в 1 миллион токенов позволяет избежать проблем с конфиденциальностью данных и затрат на сторонние API. Например, инженеры могут использовать её для автономной миграции кодовых баз, передавая репозитории и документацию в контекстное окно. LongCat-2.0 способна самостоятельно обновлять код, компилировать его, находить ошибки и создавать запросы на слияние.

Архитектура MOPD также важна для соблюдения корпоративных стандартов. Финансовые или медицинские учреждения могут использовать модель для сложных логических и математических задач, не опасаясь галлюцинаций или нарушений безопасности, так как Interaction Experts выступают в роли защитного слоя. В сочетании с бесплатным кэшированием это позволяет компаниям создавать автономные сети, которые постоянно поддерживают и оптимизируют внутреннюю инфраструктуру со значительно меньшими затратами.