Я использую Azure API преобразования речи в текст, и в настоящее время он разбивает текст на сегменты на основе Speaker_id. Таким образом, каждое предложение, которое говорит человек, разделяется на разные сегменты результата.
"SegmentResults": [
{
"RecognitionStatus": "Success",
"ChannelNumber": null,
"SpeakerId": "1"}],
"SegmentResults": [
{
"RecognitionStatus": "Success",
"ChannelNumber": null,
"SpeakerId": "1"}]
Есть ли способ объединить результаты SpeakerId в один вывод k / v.