Я пытаюсь выучить речь в текст для проекта и наткнулся на этот замечательный ресурс:...
Мне было интересно, есть ли конкретный высокоуровневый API в тензорном потоке для обучения моделей...
Я использую пакет SpeechRecognition для преобразования записи интервью с моими профессорами в txt,...
Я транскодирую некоторые аудиофайлы, используя пакет распознавания речи в Python, и получаю...
Я пытаюсь найти словарь фонем для имен людей, которые используют слова, отсутствующие в CMUDict....
Я пытаюсь использовать API идентификации докладчиков Microsoft. Есть 3 шага На первом этапе мы...
При расчете MFCC для отдельных кадров аудиосигнала, имеет ли смысл обобщать матрицу MFCC x...
Я хочу создать приложение, которое я мог бы запускать через голос, как siri или google assistant,...