Когда я пытаюсь выполнить транскрипцию речи в текст живого телефонного звонка с использованием веб-сокета.
Уже включено
const Speech = require('@google-cloud/speech').v1p1beta1;
const speech = new Speech.SpeechClient();
Со следующей конфигурацией.
encoding: 'LINEAR16',
sampleRateHertz: 8000,
languageCode: 'en-US',
useEnhanced: true,
enableSpeakerDiarization: true,
diarizationSpeakerCount: 2,
enableWordConfidence: true,
model: `phone_call`,
Я получаю следующий ответ
{
"results": [
{
"alternatives": [
{
"words": [],
"transcript": " what I'm trying to do is",
"confidence": 0.778500497341156
}
],
"isFinal": true,
"stability": 0
}
],
"error": null,
"speechEventType": "SPEECH_EVENT_UNSPECIFIED"
}
Ребята, вы знаете, почему я не получаю диаризацию динамика в ответе из облака Google для вышеуказанного конфига?