Я смог следовать официальному быстрому запуску и заставить его работать, используя клиентские библиотеки без проблем. Ниже я объясню, что я сделал.
С Облако Речи к тексту - Быстрый запуск :
Создать или выбрать проект:
gcloud config set project YOUR_PROJECT_NAME
Включить API-интерфейс Cloud Speech-to-Text для текущего проекта:
gcloud services enable speech.googleapis.com
Создать учетную запись службы:
gcloud iam service-accounts create [SA-NAME] \
--description "[SA-DESCRIPTION]" \
--display-name "[SA-DISPLAY-NAME]"
Загрузить личный ключ как JSON:
gcloud iam service-accounts keys create ~/key.json \
--iam-account [SA-NAME]@[PROJECT-ID].iam.gserviceaccount.com
Задайте для переменной среды GOOGLE_APPLICATION_CREDENTIALS
путь к файлу JSON, в котором содержится ключ учетной записи службы:
export GOOGLE_APPLICATION_CREDENTIALS="[PATH]"
Установите клиентскую библиотеку
npm install --save @google-cloud/speech
Создайте файл quickstart.js
и поместите в него следующий пример кода:
'use strict';
// [START speech_quickstart]
async function main() {
// Imports the Google Cloud client library
const speech = require('@google-cloud/speech');
const fs = require('fs');
// Creates a client
const client = new speech.SpeechClient();
// The name of the audio file to transcribe
const fileName = './resources/audio.raw';
// Reads a local audio file and converts it to base64
const file = fs.readFileSync(fileName);
const audioBytes = file.toString('base64');
// The audio file's encoding, sample rate in hertz, and BCP-47 language code
const audio = {
content: audioBytes,
};
const config = {
encoding: 'LINEAR16',
sampleRateHertz: 16000,
languageCode: 'en-US',
};
const request = {
audio: audio,
config: config,
};
// Detects speech in the audio file
const [response] = await client.recognize(request);
const transcription = response.results
.map(result => result.alternatives[0].transcript)
.join('\n');
console.log("Transcription: ${transcription}");
}
main().catch(console.error);
WHERE const fileName = './resources/audio.raw'
- это путь, по которому находится аудио test.raw.