Я пытаюсь создать веб-страницу с микрофонным входом, записывающую и отправляющую этот звук для расшифровки с помощью Dialogflow, а затем получающий текст обратно для использования на веб-странице. Например, вы говорите «радуга» в микрофоне, и с помощью декодирования Dialogflow вы видите текст «радуга» на экране.
У меня есть агент Dialogflow (у которого даже нет намерений, потому что ИИ не имеет ничего общего, кроме как просто транскрибировать аудио, как оно было сказано), но я не знаю, как его отправить / получать внешние запросы. Я новичок во всем этом и очень потерян.
Я читал о Node.js, облачных SDK Google и различных других приложениях, таких как Kommunicate, но я до сих пор не понимаю, как их использовать и для чего они предназначены. Я не могу найти кого-то еще, делающего такое же приложение, как я. Я не хочу только встроенный модуль Dialogflow, использующий их HTML-фрейм, я хочу ввод-вывод данных из Dialogflow без пользовательского интерфейса.
Некоторые люди говорят, что это возможно, а некоторые говорят, что это не так. Кажется, это должно быть четкое решение. На моей веб-странице должна быть какая-то функция вызова, которая отправляет файл .wav или что-то еще, а затем функция приема, которая получает открытый текст. Схожу с ума, пожалуйста, помогите!