Speechify на Windows: локальная транскрипция и диктовка
Приложение Speechify для Windows теперь использует локальные ИИ-модели для офлайн-транскрипции и диктовки в любых программах.
Компания Speechify, специализирующаяся на голосовом ИИ, выпустила нативное приложение для Windows. Оно позволяет диктовать текст в любых программах и читать вслух статьи, документы или PDF-файлы, используя библиотеку голосов компании.
Приложение обрабатывает голос полностью на устройстве. Это работает на Copilot+ ПК с NPU от AMD, Intel и Qualcomm, а также на других компьютерах с Windows 11, оснащенных GPU от Intel и AMD. Внутри приложения задействованы три модели: нейронный синтез речи, обнаружение голосовой активности в реальном времени и транскрипция на базе Whisper. Пользователи могут настроить приложение для работы с облачными моделями или переключаться между ними в процессе использования.
Speechify, имеющая более 50 миллионов пользователей, отмечает, что модель VITS Neural способна генерировать аудио с семью различными скоростями, что удобно для чтения документов или веб-страниц. Для обнаружения голосовой активности компания применяет открытую модель Silero. Ранее Speechify фокусировалась на преобразовании текста в речь, например, для чтения статей и писем, а также создания подкастов из документов. Сейчас компания стремится стать полноценным голосовым приложением, предлагая диктовку, транскрипцию встреч и голосового помощника.
Генеральный директор Speechify Клифф Вейцман подчеркнул, что запуск на Windows открывает доступ к миллиарду пользователей платформы. Это поможет устранить барьеры в чтении и письме, независимо от устройства или предпочтений в работе. Компания также видит большой потенциал для корпоративного сектора. В прошлом месяце Speechify представила функцию транскрипции встреч, похожую на Granola, но она была доступна только для браузерных конференций. Теперь, с появлением нативных приложений на разных платформах, эту возможность, вероятно, перенесут и в них, чтобы транскрибировать встречи из любого приложения или браузера.