У меня аналогичная проблема, когда я пытаюсь протестировать API распознавания докладчиков ->...
В настоящее время я работаю над преобразованием речи в текст с использованием Google REST API....
Я писал сценарии Praat всего несколько недель, так что терпите меня.Я пытаюсь выделить контуры...
Я хочу использовать MicroSoft Azure для поддержки API распознавания речи. по этой ссылке:...
У меня есть спектрограмма речевых сигналов, относящихся к 4 классам. Я хочу построить график...
Я хочу использовать Microsoft API для когнитивной речи в своем приложении. Кто-нибудь может описать...
Я пытаюсь создать веб-страницу с микрофонным входом, записывающую и отправляющую этот звук для...
У меня есть базовый код, который работает как: $voice = new COM("SAPI.SpVoice"); voice
Я ищу способ повысить высоту звука записанной речи. Я бы хотел изменить высоту тона только в конце...
Я пытаюсь оптимизировать и преобразовать модель тензорного потока в OpenVINO IR.Это не было очень...
Так что мне нужно выполнить обработку звука как часть моего семестра, но я хочу создать базовое...
У меня работает text2speech, но я хочу использовать GET метод, как я могу это сделать?Я хочу...
Мне нужно специализированное решение, оптимизированное для обнаружения чисел от 1 до 1000, которое...
В 2006 статье о временной классификации Классификации, Alex Graves & co. представил модель...
Я использую речевые рамки для реализации преобразования речи в текст. У меня также есть разрешение...
У меня есть слово / предложение, есть ли способ / пакет с открытым исходным кодом, чтобы найти...
Мне нужно запустить SpeechRecognizedEvent вручную для модульного тестирования, поэтому я не могу...
Я использую код ниже, чтобы прочитать случайные предложения в случайное время. Однако я сталкиваюсь...
Я пытаюсь использовать Web Speech API (https://developer.mozilla
Я хочу разделить речевой файл на несколько блоков фонем. Я видел несколько советов. например....
В соответствии с требованиями разрабатываемого приложения, я должен передать несколько аудиофайлов...
Я использую Google API для распознавания речи. Я использую 2,5-секундные аудиосэмплы. Ниже вы...
Я новичок в среде глубокого обучения, особенно в области аудио, я следую каждому шагу здесь ,...
Недавно я читаю статью 《SEGAN: Генеративная состязательная сеть по улучшению речи》.Когда я...
Недавно я прочитал статью SEGAN: Генераторная сеть против речевых улучшений .Однако я не понял...