Question

Я пытаюсь расшифровать real-time разговор двух человек через микрофон с Azure's SpeechToText когнитивным обслуживанием. Вопрос в том, какой сценарий из выборок когнитивного обслуживания лучше всего подходит для этого (я полагаю, что для этого сценария speech_recognize_continuous выборка, но я не нашел такого случая для микрофона только из файла), и можно ли разделить результаты речи? для каждого оратора.

Результат этой демонстрации должен быть таким:

    Person 1:
    Person 2:
    Person 1:
    Person 1:
    ....

Speech_recognition_language = "de-DE"

Как лучше всего показать этот разговор на Windows ОС?

Shiraz Bhaiji · Answer 1 · 22 февраля 2020

Здесь вы можете быстро начать говорить от микрофона к тексту: https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/quickstarts/speech-to-text-from-microphone?tabs=dotnet%2Cx-android%2Clinux%2Cjava-runtime&pivots=programming-language-csharp

Чтобы сделать то, что вы пытаетесь сделать, вам нужно будет запустить такую программу для каждого микрофон, тогда каждая из этих программ должна будет сообщить текст в центральном месте, чтобы распечатать разговор.

Транскрипция речи в текст для двух человек через микрофон (речь в текст azure когнитивные услуги)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Транскрипция речи в текст для двух человек через микрофон (речь в текст azure когнитивные услуги)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы