Как начать собственно «Речь к тексту»? - PullRequest
0 голосов
/ 06 мая 2019

Я - независимый автор и собрал тонны часов материала для интервью, который нужно переписать.

Просматривая Интернет, я наткнулся на IBM Watson «Речь в текст», которая должна стать идеальным решением для обработки такого огромного количества произнесенного слова.

После регистрации я с трудом даже открываю ее.Поскольку я не очень хорошо разбираюсь в программировании и т. Д.

Может ли кто-нибудь привести пример шагов, которым я могу следовать для достижения своей задачи?

Ответы [ 3 ]

0 голосов
/ 07 мая 2019

Если вы не кодер, то лучшей отправной точкой для вас будет Node-RED. Взгляните на этот урок, который создает переводчик - https://developer.ibm.com/tutorials/build-universal-translator-nodered-watson-ai-services/?cm_mmc=IBMDev--Digest--ENews2019-_-email&spMailingID=39408813&spUserID=MzYzODEwODAwNzk4S0&spJobID=1500992192&spReportId=MTUwMDk5MjE5MgS2

Если используется речь в текст, перевод и преобразование текста в речь. Вам понадобится только бит «Речь в текст». После того, как вы настроите его на работу с микрофоном, вы можете использовать инъекцию файла, чтобы пропустить ваши собственные аудиофайлы через сервис.

Для больших файлов вам нужно будет использовать http post и multi-parts, когда вы дойдете до этой точки, зададите новый вопрос, отметьте его с помощью node-red, и кто-то опубликует для вас образец потока.

0 голосов
/ 08 мая 2019

Вам не нужно иметь никаких знаний в области программирования, чтобы использовать Watson Speech To Text.Вы можете просто отправить свои файлы в сервис, используя инструмент curl.Его можно легко установить на свой компьютер, это бесплатно.

Затем вы можете отправить файл в службу, выполнив следующую команду:

curl -X POST -u "apikey:{apikey}" --header "Content-Type: audio/flac" --data-binary @audio-file2.flac "https://stream.watsonplatform.net/speech-to-text/api/v1/recognize"

Вам просто нужен apikey для запуска этогоКоманда, которую вы можете получить, выполнив следующие действия: https://cloud.ibm.com/docs/services/watson?topic=watson-iam

Затем просто замените файл .flac в этой команде на файл, который вы хотите обработать.И передайте правильное значение для заголовка Content-Type:.Для файлов Flac это audio/flac, для других аудиоформатов у вас есть список здесь: https://cloud.ibm.com/apidocs/speech-to-text

0 голосов
/ 06 мая 2019

на какой платформе вы хотите использовать службу преобразования речи в текст?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...