NeuralBox Расшифровать запись

Транскрибация аудио в текст нейросетью Whisper

Расшифровка интервью, лекций и созвонов: час записи — от 32 ₽, с таймкодами. Точная модель Whisper large-v3, русский язык — отлично.

Час записи от 32 ₽Без VPN и подпискиОплата картой РФ и СБПТаймкодыФайлы до 200 МБ

Транскрибация на NeuralBox работает на Whisper large-v3 — самой точной открытой модели распознавания речи от OpenAI. Русский язык распознаётся отлично, включая беглую речь, термины и записи с фоновым шумом. Язык записи определяется автоматически — поддерживаются десятки языков.

Результат — готовый текст плюс сегменты с таймкодами: удобно делать субтитры, искать нужное место в записи или цитировать с точностью до секунды. Если в файле не оказалось речи, токены автоматически возвращаются.

Никаких подписок и помесячных тарифов «от $10», как у сервисов-транскрибаторов: загрузили файл — заплатили за его длительность. Час записи стоит от 32 ₽ (Fast Whisper) или 54 ₽ (WhisperX — максимальная точность). Файлы до 200 МБ, оплата российской картой, через СБП или криптовалютой.

Модели распознавания

Fast Whisper (large-v3)
3 токена/сек ≈ 32 ₽ за час
Быстрая и экономичная: та же базовая модель large-v3 в ускоренном исполнении. Для большинства записей.
WhisperX (large-v3)
5 токенов/сек ≈ 54 ₽ за час
Максимальная точность и аккуратные таймкоды на уровне слов — для субтитров и сложных записей.
Таймкоды и сегменты
включено
Текст разбит на фрагменты с привязкой ко времени — основа для субтитров и навигации по записи.
Автоопределение языка
включено
Не нужно указывать язык записи — модель определит его сама. Десятки языков.

Что умеет транскрибация

🎯
Точность large-v3
Старшая модель Whisper: справляется с беглой речью, акцентами, терминами и фоновым шумом.
⏱️
Таймкоды
Каждый фрагмент текста привязан ко времени — переходите к нужному месту записи в один клик.
🌍
Десятки языков
Русский, английский, европейские и азиатские языки — с автоопределением.
📦
Большие файлы
До 200 МБ — многочасовые диктофонные записи и подкасты целиком.
🛡️
Возврат за тишину
Если речи в файле не оказалось — токены вернутся автоматически.
⚙️
API
Транскрибация по API — автоматизируйте расшифровку звонков и контента.

Для чего используют

Загрузите аудиофайл — текст будет готов через пару минут.

Интервью и подкасты
Расшифровка часового интервью за пару минут вместо вечера ручной работы — со ссылками на таймкоды
Лекции и вебинары
Конспект из записи: расшифруйте лекцию, а затем попросите чат-модель сделать из текста структурированный конспект
Созвоны и встречи
Запись зум-колла → текст → саммари с задачами. Хорошо работает связка с чатом NeuralBox
Субтитры
Сегменты с таймкодами из WhisperX — готовая основа для субтитров к видео
Диктофонные заметки
Голосовые мысли и заметки в дороге — в аккуратный текст
Колл-центр через API
Автоматическая расшифровка звонков для контроля качества и аналитики

Параметры и ограничения

МоделиWhisperX (large-v3), Fast Whisper (large-v3)
Размер файладо 200 МБ
ФорматыMP3, WAV, M4A, OGG и другие аудиоформаты
Языкидесятки, включая русский; автоопределение
Результатполный текст + сегменты с таймкодами
Минимальное списание250–500 токенов (≈ 1–1,5 ₽) за короткие файлы
Доступ по APIда — API NeuralBox

Сколько стоит транскрибация

ЗаписьFast WhisperWhisperX
10 минут1 800 токенов ≈ 5,4 ₽3 000 токенов ≈ 9 ₽
30 минут5 400 токенов ≈ 16 ₽9 000 токенов ≈ 27 ₽
1 час10 800 токенов ≈ 32 ₽18 000 токенов ≈ 54 ₽
3 часа32 400 токенов ≈ 97 ₽54 000 токенов ≈ 162 ₽

Тарификация посекундная, по длительности записи. Курс токена — по тарифу Basic (449 ₽ = 150 000 токенов), на старших тарифах до 40% дешевле. Для сравнения: API OpenAI Whisper ($0.006/мин) недоступен из России, а сервисы-транскрибаторы продают подписки от $10–20/мес.

Стартовый пакет — 179 ₽ за 30 000 токенов: это почти 3 часа расшифровки в Fast Whisper.

Как расшифровать запись

Войдите
Регистрация через Telegram, Google, VK или по email — меньше минуты.
Пополните баланс
От 179 ₽ — российской картой, через СБП или криптовалютой.
Загрузите файл
Вкладка «Аудио» → выберите модель → загрузите запись. Текст с таймкодами — через пару минут.

Расшифровать запись

Частые вопросы

Насколько точная расшифровка?

Используется Whisper large-v3 — самая точная открытая модель распознавания речи. На чистой русской речи ошибки единичны; на записях с шумом и перебиваниями качество выше у WhisperX.

Сколько стоит расшифровать час?

От 32 ₽ в Fast Whisper и 54 ₽ в WhisperX (по базовому тарифу; на старших — до 40% дешевле). Платите только за длительность записи, подписки нет.

Какие языки поддерживаются?

Десятки языков, включая русский, английский, европейские и азиатские. Язык определяется автоматически, указывать его не нужно.

Есть ли таймкоды?

Да, результат включает сегменты с привязкой ко времени. Для максимально точных таймкодов (субтитры) берите WhisperX.

Чем WhisperX отличается от Fast Whisper?

Обе работают на large-v3. Fast Whisper в полтора раза дешевле и быстрее — для большинства записей. WhisperX точнее выравнивает таймкоды и лучше держит сложный звук.

Можно ли расшифровать видео?

Загружается аудиофайл. Извлеките дорожку из видео (любой конвертер) — и расшифровывайте. Файлы до 200 МБ — это многочасовые записи.

Что если в файле нет речи?

Токены автоматически вернутся на баланс — за тишину и музыку без слов вы не платите.

Есть ли API?

Да, транскрибация доступна по API NeuralBox — удобно для автоматической обработки звонков и контента. Документация на neuralbox.ru/api.

Расшифруйте первую запись

179 ₽ = почти 3 часа расшифровки. Без VPN, без подписки.

Начать