Как определить другой динамик с облачным API Google Speech? - PullRequest
1 голос
/ 27 марта 2019

Я создаю что-то вроде «мозгового штурма»: группа людей может выкрикивать слова в микрофон. Ввод переведен в текст (Google речь в текст) и отображается в облаке слов. Облако слов группирует одни и те же слова (или термины). Но я не могу правильно определить отдельные термины. Google может только разделить ввод, если между ними будет долгое молчание. Если два человека кричат ​​друг за другом, разные идеи рассматриваются как одна идея. Это не то, что я хочу. Есть идеи? Например. один человек говорит «темно-синий», а один человек говорит «темно-красный». Google дает мне один вывод "темно-синий темно-красный".

1 Ответ

1 голос
/ 13 апреля 2019

У них есть экспериментальная функция диаризации динамика , но она работает не очень надежно.Разделение динамиков поддерживается и другими инструментами и API.

...