Лучшие ИИ-приложения для голосового набора текста

TechCrunch протестировал и составил рейтинг лучших приложений для голосового ввода на базе ИИ. Они помогут отвечать на письма, делать заметки и даже писать код.

ИИ-приложение для голосового набора текста на экране смартфона

Современные приложения для голосового набора текста значительно улучшились. Раньше они работали медленно и неточно, если речь не была идеально чёткой. Благодаря развитию больших языковых моделей и технологий преобразования речи в текст, эти системы теперь распознают речь точнее, сохраняя контекст для правильного форматирования.

Разработчики добавили функции автоматического удаления слов-паразитов, исправления ошибок и расстановки пунктуации. Это позволяет получать текст, требующий минимум правок. На рынке представлено множество таких приложений, и среди них выделяются следующие:

  • Wispr Flow — приложение для диктовки с ИИ, позволяющее добавлять пользовательские слова и инструкции. Оно предлагает нативные версии для macOS, Windows и iOS, а версия для Android находится в разработке. Пользователи могут выбирать стили транскрипции: «формальный», «повседневный» или «очень повседневный». Бесплатный тариф включает до 2000 слов в неделю на ПК и 1000 слов в месяц на iOS; платные подписки начинаются от $15 в месяц.
  • Willow позиционируется как средство экономии времени для тех, кто не любит печатать. Помимо стандартных функций редактирования и форматирования, приложение использует большие языковые модели для создания полных текстовых фрагментов из нескольких продиктованных слов. Оно ориентировано на конфиденциальность, храня все транскрипции локально на устройстве, и позволяет отказаться от обучения модели. Бесплатная версия на ПК даёт 2000 слов в месяц; индивидуальные подписки начинаются от $15 в месяц, открывая неограниченную диктовку.
  • Monologue подойдёт тем, для кого конфиденциальность в приоритете, так как позволяет загружать модель ИИ прямо на устройство, избегая облачного хранения. Приложение также адаптирует тон в зависимости от используемой программы. Бесплатный тариф включает 1000 слов в месяц; подписка стоит $10 в месяц или $100 в год. Активным пользователям компания отправляет физическое устройство Monokey для быстрого доступа.
  • Superwhisper — это в первую очередь приложение для диктовки, но оно также умеет транскрибировать аудио- и видеофайлы. Пользователи могут выбирать и загружать различные модели ИИ, включая собственные с разной скоростью и точностью, а также модели Nvidia Parakeet. Приложение позволяет создавать пользовательские подсказки для управления результатом и просматривать обработанные и необработанные транскрипции. Базовая функция преобразования голоса в текст бесплатна; платный уровень предлагает безлимитное использование и подключение облачных/локальных моделей за $8.49 в месяц или $249.99 за пожизненную подписку.
  • VoiceTypr работает в режиме офлайн и не требует подписки, используя локальные модели для транскрипции. Для тех, кто хочет разместить и запустить открытую версию самостоятельно, есть репозиторий на GitHub. Приложение поддерживает более 99 языков и работает на Mac и Windows. Доступна трёхдневная бесплатная пробная версия, после чего можно приобрести пожизненную лиценцию: $35 за одно устройство, $56 за два и $98 за четыре.
  • Aqua, поддерживаемое Y Combinator, — это приложение для голосового набора текста для Windows и macOS, которое выделяется низкой задержкой. Оно не только обрабатывает грамматику и пунктуацию, но и позволяет автозаполнять текст, например, вводя адрес по голосовой команде. Бесплатный тариф даёт 1000 слов в месяц; платные планы начинаются от $8 в месяц при ежегодной оплате, предлагая неограниченное количество слов и 800 пользовательских словарных значений.
  • Handy — это бесплатный инструмент для транскрипции с открытым исходным кодом, работающий на Mac, Windows и Linux. Приложение достаточно простое и не предлагает много настроек, но является хорошим вариантом для тех, кто хочет начать использовать голосовой ввод без затрат. В нём есть базовое меню настроек для переключения режима «нажми и говори» и изменения горячей клавиши активации.
  • Typeless отличается большим объёмом бесплатных слов и заявляет, что не хранит данные и не использует их для обучения ИИ-моделей. Приложение также может переписывать неудачные предложения. На бесплатном тарифе доступно до 4000 слов в неделю (около 16000 слов в месяц). Платная подписка за $12 в месяц (при ежегодной оплате) открывает неограниченное количество слов и доступ к новым функциям. Typeless доступно для Windows и macOS.
  • VoiceInk — это приватное приложение для диктовки с открытым исходным кодом для Mac. Оно поддерживает глобальные горячие клавиши для записи и режим «нажми и говори». Приложение анализирует контекст на экране и соответствующим образом корректирует вывод, а также может автоматически применять форматирование к определённым приложениям или URL-адресам. Есть режим ассистента, отвечающий на вопросы. Стоимость пожизненного доступа: $25 за одно устройство, $39 за два и $49 за три.
  • Dictato — приложение для Mac стоимостью €9.99 (около $12), предлагающее пожизненный доступ и два года обновлений. Оно работает с офлайн-моделями, такими как Parakeet, Whisper и Apple Speech Analyzer, и использует Apple Intelligence для лёгкого чтения и удаления слов-паразитов. Благодаря локальным моделям, приложение обеспечивает низкую задержку в 80 мс, то есть текст появляется почти мгновенно после произнесения.
  • AudioPen начиналось как веб-приложение для голосовых заметок, но теперь доступно и на Mac. Оно позволяет диктовать текст и переписывать его в нужном формате и стиле, переключаясь между ними. Кроме живой транскрипции, AudioPen сохраняет аудиозаметки на разных платформах, объединяет их для создания сводок, загружает аудиофайлы и переписывает существующие заметки с помощью ИИ. Стоимость: $33 за три месяца, $99 за год и $159 за два года.