Вопросы с тегом речь

0 голосов

0 ответов

Неверный формат аудио: не файл WAVE - нет заголовка RIFF

У меня аналогичная проблема, когда я пытаюсь протестировать API распознавания докладчиков ->...

marsh1979 / 18 июня 2019

2 голосов

1 ответ

Как связать / синхронизировать полный список контактов с Google речевым API (REST)

В настоящее время я работаю над преобразованием речи в текст с использованием Google REST API....

RC0993 / 18 июня 2019

0 голосов

0 ответов

Praat - Ошибка при обработке Pitch файла .wav: «минимальный шаг не должен быть меньше ...»

Я писал сценарии Praat всего несколько недель, так что терпите меня.Я пытаюсь выделить контуры...

Silverwing171 / 06 июня 2019

0 голосов

0 ответов

как использовать microsoft Azure Speech Translation слушайте голос системы ， не слушайте микрофон ， я работаю на C #

Я хочу использовать MicroSoft Azure для поддержки API распознавания речи. по этой ссылке:...

醉月问天 / 16 мая 2019

0 голосов

1 ответ

Построение диаграммы рассеяния TSNE для речевых спектрограмм

У меня есть спектрограмма речевых сигналов, относящихся к 4 классам. Я хочу построить график...

Sandeep Pandey / 10 мая 2019

0 голосов

1 ответ

Как интегрировать службу когнитивной речи Microsoft в андроид студию?

Я хочу использовать Microsoft API для когнитивной речи в своем приложении. Кто-нибудь может описать...

Clary / 06 мая 2019

0 голосов

0 ответов

Вызов Dialogflow с веб-сайта и получение текстового ответа

Я пытаюсь создать веб-страницу с микрофонным входом, записывающую и отправляющую этот звук для...

brian / 05 мая 2019

0 голосов

0 ответов

Как изменить SAPI VOICES в Windows [PHP]

У меня есть базовый код, который работает как: $voice = new COM("SAPI.SpVoice"); voice

xloss / 04 мая 2019

0 голосов

1 ответ

Алгоритм изменения высоты речи

Я ищу способ повысить высоту звука записанной речи. Я бы хотел изменить высоту тона только в конце...

Ran / 29 апреля 2019

0 голосов

1 ответ

Как обеспечить статические формы в модели Tensorflow для простого преобразования OpenVINO?

Я пытаюсь оптимизировать и преобразовать модель тензорного потока в OpenVINO IR.Это не было очень...

Sujeendran Menon / 25 апреля 2019

0 голосов

0 ответов

Как использовать пользовательскую обработку звука с MFCC для обучения тензорного классификатора

Так что мне нужно выполнить обработку звука как часть моего семестра, но я хочу создать базовое...

Night / 17 апреля 2019

0 голосов

1 ответ

Ошибка Text2Speech, Как я могу воспроизвести аудио, введя URL в браузер напрямую?

У меня работает text2speech, но я хочу использовать GET метод, как я могу это сделать?Я хочу...

xloss / 13 апреля 2019

2 голосов

1 ответ

API или SDK для распознавания речи только по номерам (от 1 до 10000)?

Мне нужно специализированное решение, оптимизированное для обнаружения чисел от 1 до 1000, которое...

fvisticot / 05 апреля 2019

1 голос

0 ответов

CTC: В чем разница между пробелом и пробелом?

В 2006 статье о временной классификации Классификации, Alex Graves & co. представил модель...

Nicole D. / 21 марта 2019

0 голосов

0 ответов

Как запретить Speech.Framework iOS доступ к списку контактов?

Я использую речевые рамки для реализации преобразования речи в текст. У меня также есть разрешение...

Yoseph Wijaya / 21 марта 2019

0 голосов

1 ответ

У меня есть слово или предложение, есть ли способ / пакет с открытым исходным кодом, чтобы найти вероятность того, что пользователь произнес это слово

У меня есть слово / предложение, есть ли способ / пакет с открытым исходным кодом, чтобы найти...

thiran509 / 21 марта 2019

0 голосов

2 ответов

Вручную запустить SpeechRecognizedEvent

Мне нужно запустить SpeechRecognizedEvent вручную для модульного тестирования, поэтому я не могу...

Dardguy / 20 марта 2019

1 голос

1 ответ

AVSpeechSynthesizer не работает при добавлении новых строк для произнесения речи [xcode - swift 4]

Я использую код ниже, чтобы прочитать случайные предложения в случайное время. Однако я сталкиваюсь...

Dan.code / 20 марта 2019

0 голосов

0 ответов

Форматирование чисел в Web Speech API

Я пытаюсь использовать Web Speech API (https://developer.mozilla

Rapha Guasta / 19 марта 2019

0 голосов

0 ответов

Как я могу сегментировать речь по фонемам?

Я хочу разделить речевой файл на несколько блоков фонем. Я видел несколько советов. например....

Fredric Cliver / 15 марта 2019

1 голос

0 ответов

Ошибка при запуске нескольких SFSpeechRecognitionTask в фоновом режиме

В соответствии с требованиями разрабатываемого приложения, я должен передать несколько аудиофайлов...

Talha Ahmad Khan / 13 марта 2019

1 голос

0 ответов

Google Speech-to-Text API: отсутствует или плохая достоверность для распознавания речи

Я использую Google API для распознавания речи. Я использую 2,5-секундные аудиосэмплы. Ниже вы...

Phys / 11 марта 2019

0 голосов

0 ответов

Индекс превышает количество элементов массива (0)

Я новичок в среде глубокого обучения, особенно в области аудио, я следую каждому шагу здесь ,...

Anchor Ryuujin / 27 февраля 2019

0 голосов

0 ответов

что означает make_z в генераторе

Недавно я читаю статью 《SEGAN: Генеративная состязательная сеть по улучшению речи》.Когда я...

yunyang / 26 февраля 2019

0 голосов

0 ответов

Разница между AEGenerator и Generator в модели SEGAN для улучшения речи

Недавно я прочитал статью SEGAN: Генераторная сеть против речевых улучшений .Однако я не понял...

yunyang / 22 февраля 2019