Я работаю над улучшением точности для модели «Речь в текст» и ищу способы реализовать то же самое в браузере с помощью TensorFlow. js. В настоящее время я использую облачный API Google для преобразования текста в текст, однако не удовлетворен точностью, которую обеспечивает модель.
Моя цель - извлечь текст непосредственно из браузера и обработать данные с помощью TensorFlow. js, сохраните его в облаке Google и сравните с результатами Google Speech API. Ваши рекомендации будут действительно полезны в отношении любых существующих реализаций, предварительно обученных моделей, исследовательской работы, веб-сайтов и др. c. Заранее спасибо.