Мне нужно автоматически транскрибировать несколько коротких MP3-файлов как часть доказательства концепции, над которой я работаю. В настоящее время я ищу облачные решения или службы веб-API для отправки MP3 в виде простого HTTP-запроса и получения транскрипции.
Единственное бесплатное / открытое решение, которое я нашел здесь , но демонстрации, похоже, не работают (по крайней мере, не для файлов, которые мне нужно записать) Я нашел несколько корпоративных решений для колл-центров, но пока ничего не могу просто интегрировать в проект.
Существуют ли какие-либо веб-службы распознавания речи? Тот, который способен отфильтровать небольшой шум, был бы плюсом.