Как повысить точность Azure Speech-to-Text API? - PullRequest
0 голосов
/ 21 января 2020

В последние несколько недель я пытался найти хороший API для преобразования речи в текст для бразильского португальского языка. Я пробовал Google Cloud, Amazon, IBM и Microsoft, но никто не дал мне такой точный результат, как это приложение . Это приложение поддерживает несколько языков и даже знаки препинания! Я не верю, что разработчик подготовил модель для более чем 20 языков, которые он предлагает. Хотя я не могу знать, какой API использует этот парень (я отправил ему электронное письмо, но пока не получил никакого ответа), я начал использовать Azure CognitveServices Speech Api, который через мои тесты был самый точный. Тем не менее, я все еще не удовлетворен полученными транскрипциями. Есть ли способ повысить точность? Моя цель - расшифровать различные виды од ios: интервью, лекции и т. Д. c. Это не всегда будет один и тот же оратор или одна и та же среда. Даже если входные файлы имеют разный характер, стоит ли обучать мою собственную модель?

Любые советы приветствуются.

Я использовал этот код

Заранее спасибо!

...