Google Cloud Speech to Text API - диаризация динамиков - PullRequest
1 голос
/ 09 июня 2019

Когда я пытаюсь выполнить транскрипцию речи в текст живого телефонного звонка с использованием веб-сокета.

Уже включено

const Speech = require('@google-cloud/speech').v1p1beta1;

const speech = new Speech.SpeechClient();

Со следующей конфигурацией.

encoding: 'LINEAR16',
sampleRateHertz: 8000,
languageCode: 'en-US',
useEnhanced: true,
enableSpeakerDiarization: true,
diarizationSpeakerCount: 2,
enableWordConfidence: true,
model: `phone_call`,

Я получаю следующий ответ

{
  "results": [
    {
      "alternatives": [
        {
          "words": [],
          "transcript": " what I'm trying to do is",
          "confidence": 0.778500497341156
        }
      ],
      "isFinal": true,
      "stability": 0
    }
  ],
  "error": null,
  "speechEventType": "SPEECH_EVENT_UNSPECIFIED"
}

Ребята, вы знаете, почему я не получаю диаризацию динамика в ответе из облака Google для вышеуказанного конфига?

...