Google речь к тексту API задержки задержки - PullRequest
0 голосов
/ 12 января 2020

Я попытался преобразовать аудиофайл (формат WAV) в текст, используя Google speech to text API, и запросил время ответа. Ниже приведен код и продолжительность ответа.

Размер аудиофайла составляет около 30 КБ, а продолжительность - 3 секунды. Речевой текстовый сервис занял около 1,7 секунды, чтобы расшифровать текст, который, по моему мнению, слишком высок и должен быть в миллисекундах. Это нормально или мне не хватает какой-то конфигурации?

Цените любые предложения.

const speech = require('@google-cloud/speech');
const fs = require('fs');

// Creates a client
const client = new speech.SpeechClient();

// The name of the audio file to transcribe
const fileName = 'xxx.wav';

// Reads a local audio file and converts it to base64
const file = fs.readFileSync(fileName);
const audioBytes = file.toString('base64');


// The audio file's encoding, sample rate in hertz, and BCP-47 language code
const audio = {
content: audioBytes,
};
const config = {
encoding: 'MULAW',
sampleRateHertz: 8000,
languageCode: 'en-GB',
model: 'default',
use_enhanced: 'true',
metadata: {InteractionType: 'VOICE_SEARCH',
microphoneDistance: 'NEARFIELD',
OriginalMediaType: 'AUDIO',
RecordingDeviceType: 'PHONE_LINE'},
};
const request = {
audio: audio,
config: config,
};

const [response] = await client.recognize(request);

const transcription = response.results
.map(result => result.alternatives[0].transcript)
.join('\n');
console.log(`Transcription: ${transcription}`);

1 Ответ

0 голосов
/ 12 января 2020

Пожалуйста, проверьте скорость вашего сетевого подключения (inte rnet speed)

Если скорость вашей сети будет низкой, общее время отклика будет больше.

проверьте время загрузки файла на Облако Google.

...