OpenAI представила GPT-Rosalind для наук о жизни и плагин Codex

OpenAI запускает GPT-Rosalind, новую модель с ограниченным доступом для бионаук, и расширяет плагин Codex на GitHub. Цель — ускорить исследования в этой области.

Логотип OpenAI и символы, связанные с науками о жизни и ИИ, GPT-Rosalind

OpenAI представила новую специализированную модель GPT-Rosalind. Она призвана ускорить процесс разработки лекарств и научных исследований в области биологии. Модель названа в честь химика Розалинд Франклин.

Путь от лабораторной гипотезы до аптечной полки занимает до 15 лет и миллиарды долларов. Прогресс часто замедляют разрозненные рабочие процессы. GPT-Rosalind создана для решения этой проблемы, делая исследования эффективнее. Модель синтезирует данные, генерирует биологические гипотезы и планирует эксперименты. Это задачи, которые раньше требовали многолетнего опыта человека.

GPT-Rosalind — первая в новой серии моделей, оптимизированных для научных рабочих процессов. Если предыдущие версии GPT хорошо справлялись с общими языковыми задачами, то эта модель глубоко понимает геномику, инженерию белков и химию. OpenAI меняет роль ИИ с универсального помощника на специализированного партнера в области «рассуждений».

OpenAI проверила возможности модели на отраслевых тестах. На BixBench, который оценивает биоинформатику и анализ данных, GPT-Rosalind показала лидирующие результаты. В тестах LABBench2 модель превзошла GPT-5.4 в шести из одиннадцати задач. Наибольший прирост заметен в CloningQA, где требовалось проектировать реагенты для протоколов молекулярного клонирования.

Результаты партнерства с Dyno Therapeutics также впечатляют. GPT-Rosalind предсказывала функции и генерировала РНК-последовательности. В среде Codex модель показала результаты выше 95-го процентиля среди экспертов-людей по задачам предсказания. Для генерации последовательностей она достигла 84-го процентиля. Это говорит о способности модели выявлять «экспертно-значимые закономерности», которые часто упускают универсальные модели.

OpenAI не просто выпускает модель, а создает целую экосистему. Она интегрируется с инструментами, которые ученые уже используют. Главный элемент — новый плагин для научных исследований в области наук о жизни для Codex, доступный на GitHub. Научные исследования часто разрознены. Один проект может требовать обращения к базам данных белков, изучения литературы и использования разных инструментов. Плагин выступает как «уровень оркестровки», объединяя эти многоэтапные задачи.

  • Навыки: Модульные навыки для биохимии, генетики человека, функциональной геномики и клинических данных.
  • Подключение: Соединяет модели с более чем 50 публичными мультиомиксными базами данных и литературными источниками.
  • Эффективность: Автоматизирует повторяющиеся задачи, такие как поиск структур белков и последовательностей.

Учитывая потенциал модели, OpenAI не делает ее общедоступной. Вместо этого запущена программа «Доверенный доступ». Модель выходит как предварительная версия для исследований. Она доступна квалифицированным корпоративным клиентам в США.

Это ограниченное развертывание основано на трех принципах: полезное использование, строгое управление и контролируемый доступ. Организации, запрашивающие доступ, проходят проверку безопасности. Это гарантирует легитимность исследований и их общественную пользу. GPT-Rosalind разработана с усиленными мерами безопасности корпоративного уровня.

  • Ограниченный доступ: Использование только для одобренных пользователей в безопасных средах.
  • Управление: Участвующие организации должны соблюдать строгие меры по предотвращению злоупотреблений.
  • Стоимость: Во время предварительного просмотра модель не расходует существующие кредиты или токены. Это позволяет исследователям экспериментировать без немедленных бюджетных ограничений.

Анонс получил поддержку от партнеров OpenAI в фармацевтической и технологической отраслях. Шон Бруич, старший вице-президент по ИИ и данным в Amgen, отметил, что сотрудничество ускорит доставку лекарств пациентам.

  • NVIDIA: Кимберли Пауэлл, вице-президент по здравоохранению и наукам о жизни, видит в этом способ «сократить годы традиционных исследований и разработок» до быстрых научных выводов.
  • Moderna: Генеральный директор Стефан Бансель подчеркнул способность модели «рассуждать на основе сложных биологических данных». Это поможет командам переводить идеи в экспериментальные рабочие процессы.
  • Allen Institute: Технический директор Энди Хикл отметил, что GPT-Rosalind делает ручные шаги, такие как поиск и выравнивание данных, более «последовательными и повторяемыми».

Это дополняет уже достигнутые результаты. Например, сотрудничество с Ginkgo Bioworks, где модели ИИ помогли снизить затраты на производство белков на 40%.

Миссия OpenAI с GPT-Rosalind — сократить разрыв между научной идеей и необходимыми для медицинского прогресса экспериментами и решениями. Компания сотрудничает с Лос-Аламосской национальной лабораторией, исследуя ИИ-управляемый дизайн катализаторов. GPT-Rosalind позиционируется как «способный партнер в открытиях». По мере того, как науки о жизни становятся все более насыщенными данными, специализированные модели «рассуждений» могут стать стандартом для навигации в огромных пространствах биологии и химии.