Meituan открыла код LongCat-2.0: AI-модель для кодинга
Китайская Meituan представила LongCat-2.0 – 1.6-триллионную AI-модель для кодирования, обученную на китайских чипах.
Китайская компания Meituan, известная своим приложением для доставки, представила свою новую ИИ-модель LongCat-2.0. Анонс состоялся 30 июня 2026 года в 08:39 по московскому времени на платформах GitHub, Hugging Face и собственной площадке компании. Эта модель, ранее известная как анонимный проект «Owl Alpha», два месяца лидировала в глобальных чартах разработчиков на OpenRouter, демонстрируя впечатляющие возможности.
LongCat-2.0 — это система Mixture-of-Experts (MoE) с 1,6 триллионами параметров, разработанная для изменения рынка автономной разработки программного обеспечения. Модель предлагает нативное контекстное окно в 1 миллион токенов и распространяется под очень гибкой лицензией MIT, что делает её коммерчески привлекательной. Важная особенность: модель обучена на более чем 50 000 китайских специализированных интегральных схемах (ASIC), что демонстрирует независимость от американских графических процессоров Nvidia, доминирующих в обучении ИИ.
Meituan предлагает агрессивную ценовую политику. Обработка кэшированных контекстных запросов полностью бесплатна. Также доступны временные «пакеты токенов» по акции. Стандартная оплата по мере использования для некэшированных запросов составляет $0.75 за миллион входных токенов и $2.95 за миллион выходных токенов. Однако сейчас действует акционная цена: $0.30 за миллион входных токенов и $1.20 за миллион выходных токенов, что делает LongCat-2.0 одной из самых доступных моделей на рынке.
Сравнение цен на миллион токенов (вход/выход/общая стоимость):
- MiMo-V2.5 Flash: $0.10 / $0.30 / $0.40
- deepseek-v4-flash: $0.14 / $0.28 / $0.42
- deepseek-v4-pro: $0.435 / $0.87 / $1.305
- MiniMax-M3: $0.30 / $1.20 / $1.50
- LongCat-2.0 (акция): $0.30 / $1.20 / $1.50
- Gemini 3.1 Flash-Lite: $0.25 / $1.50 / $1.75
- Qwen3.7-Plus: $0.40 / $1.60 / $2.00
- MiMo-V2.5: $0.40 / $2.00 / $2.40
- LongCat-2.0 (стандарт): $0.75 / $2.95 / $3.70
- Grok 4.3 (низкий контекст): $1.25 / $2.50 / $3.75
- MiMo-V2.5 Pro (≤256K): $1.00 / $3.00 / $4.00
- Kimi-K2.6: $0.95 / $4.00 / $4.95
- GLM-5.2: $1.40 / $4.40 / $5.80
- GPT-5.6 Luna: $1.00 / $6.00 / $7.00
- Grok 4.3 (высокий контекст): $2.50 / $5.00 / $7.50
- MiMo-V2.5 Pro (>256K): $2.00 / $6.00 / $8.00
- Qwen3.7-Max: $2.50 / $7.50 / $10.00
- Gemini 3.5 Flash: $1.50 / $9.00 / $10.50
- Gemini 3.1 Pro Preview (≤200K): $2.00 / $12.00 / $14.00
- GPT-5.6 Terra: $2.50 / $15.00 / $17.50
- GPT-5.4: $2.50 / $15.00 / $17.50
- Gemini 3.1 Pro Preview (>200K): $4.00 / $18.00 / $22.00
- Claude Opus 4.8: $5.00 / $25.00 / $30.00
- GPT-5.5: $5.00 / $30.00 / $35.00
- GPT-5.5 Instant (chat-latest): $5.00 / $30.00 / $35.00
- Sakana Fugu Ultra (≤272K): $5.00 / $30.00 / $35.00
- GPT-5.6 Sol: $5.00 / $30.00 / $35.00
- Claude Fable 5 / Claude Mythos 5: $10.00 / $50.00 / $60.00
LongCat-2.0 оптимизирует разреженность MoE, масштабируя общее количество параметров до 1,6 триллиона, но ограничивая активные вычисления в среднем до 48 миллиардов параметров на токен. Это достигается за счёт фреймворка «Zero-Compute Experts», который направляет рутинные операции через более лёгкие подсети, устраняя избыточные вычислительные затраты. Для поддержания контекстного окна в 1 миллион токенов без аппаратных ограничений Meituan внедрила LongCat Sparse Attention (LSA), которая решает проблемы квадратичных затрат на оценку и фрагментации памяти.
LSA использует три метода: Streaming-aware Indexing (SI) для оптимизации чтения данных, Cross-Layer Indexing (CLI) для распределения вычислений между слоями и Hierarchical Indexing (HI) для двухэтапной оценки токенов. Кроме того, модель включает модуль N-gram Embedding, расширяющий пространство встраивания в 100 раз. Это позволяет LongCat-2.0 лучше улавливать локальные связи между токенами и ускорять пакетные операции.
Модель LongCat-2.0 ориентирована на многоэтапные инженерные задачи, интеграцию инструментов и автоматизированное управление репозиториями. В тестах SWE-bench Pro она набрала 59.5 баллов, превзойдя GPT-5.5 (58.6). Также модель показала 70.8 на Terminal-Bench 2.1, 77.3 на SWE-bench Multilingual и 73.2 на симуляторе корпоративных рабочих процессов FORTE. Эти результаты подтверждают её специализацию в области программной инженерии.
Такое поведение достигается благодаря пост-тренировочному слою MOPD (Multi-Teacher Optimization via Mixture of Specialized Experts). Он разделяет оптимизацию на три независимых кластера экспертов: Agent Experts для выполнения задач и работы с инструментами, Reasoning Experts для логики и решения сложных проблем, а также Interaction Experts для взаимодействия с пользователем, предотвращения галлюцинаций и соблюдения правил безопасности. Динамический механизм маршрутизации объединяет эти специализации во время работы модели.
Meituan, основанная в марте 2010 года Ван Сином, прошла путь от сайта ежедневных скидок до доминирующего «суперприложения» в Китае. После слияния с Dianping в 2015 году компания стала лидером в сфере доставки, обзоров, бронирования отелей и других услуг. Столкнувшись с жёсткой конкуренцией и снижением прибыли, Meituan направила миллиарды инвестиций в ИИ и разработку собственных чипов. Выпуск LongCat-Flash в конце 2025 года и последующих моделей показал амбиции компании стать ключевым игроком в глобальной инфраструктуре ИИ.
Для компаний LongCat-2.0 открывает новые возможности в разработке ПО и системных операциях. Модель с открытым исходным кодом, лицензией MIT и контекстным окном в 1 миллион токенов позволяет избежать проблем с конфиденциальностью данных и затрат на сторонние API. Например, инженеры могут использовать её для автономной миграции кодовых баз, передавая репозитории и документацию в контекстное окно. LongCat-2.0 способна самостоятельно обновлять код, компилировать его, находить ошибки и создавать запросы на слияние.
Архитектура MOPD также важна для соблюдения корпоративных стандартов. Финансовые или медицинские учреждения могут использовать модель для сложных логических и математических задач, не опасаясь галлюцинаций или нарушений безопасности, так как Interaction Experts выступают в роли защитного слоя. В сочетании с бесплатным кэшированием это позволяет компаниям создавать автономные сети, которые постоянно поддерживают и оптимизируют внутреннюю инфраструктуру со значительно меньшими затратами.