Так как это мой первый вопрос, я с радостью получу советы о том, как лучше задать вопрос.
В настоящее время я разрабатываю приложение в Electron-Vue, и мы хотим добавить Google Speech-Текстовый поток.Я могу заставить его работать для аудиофайла, но не для потока с микрофона.Вот шаги, которые необходимо предпринять, чтобы воспроизвести мою проблему.
npm install -g vue-cli
vue init simulatedgreg/electron-vue my-project
Настройте консольный проект GCP и получите учетные данные, как описано здесь: https://cloud.google.com/speech-to-text/docs/quickstart-client-libraries
Установите и инициализируйте Cloud SDK, как описано здесь: https://cloud.google.com/sdk/docs/
Установите SoX и добавьте его в переменную PATH https://sourceforge.net/projects/sox/files/latest/download
Установите GRPC специально для целевой электронной версии.Simulatedgreg использует 2.0.14:
npm install --runtime=electron --target=2.0.14 --disturl=https://atom.io/download/electron
Установите облачную речь Google и node-record-lpcm-16
npm install @google-cloud/speech
npm install node-record-lpcm16
Теперь для тех, кто не может настроить API Google Speech to Text.работая на NodeJS, этот шаг важен.Перейдите в node_modules, найдите node-record-lpcm16 и откройте index.js.Измените cmdArgs следующим образом:
var cmd = 'sox';
var cmdArgs = [
'-q', // show no progress
'-t', 'waveaudio', // input-type
'-d', // use default recording device
'-r', options.sampleRate.toString(), // sample rate
'-c', '1', // channels
'-e', 'signed-integer', // sample encoding
'-b', '16', // precision (bits)
'-t', 'raw', // output-type
'-' // pipe
];
Поместите файл credentials.json, созданный с помощью API, в папку проекта.
И, наконец, сам код Vue:
<template>
<div id="wrapper">
<button @click="record">Test</button>
</div>
</template>
<script>
export default {
name: 'landing-page',
methods: {
record(){
this.version = process.versions.electron;
const record = require('node-record-lpcm16');
// Imports the Google Cloud client library
const speech = require('@google-cloud/speech');
// Creates a client
const client = new speech.SpeechClient({
keyFilename: './credentials.json'
});
const encoding = 'LINEAR16';
const sampleRateHertz = 16000;
const languageCode = 'nl-NL';
const request = {
config: {
encoding: encoding,
sampleRateHertz: sampleRateHertz,
languageCode: languageCode,
},
interimResults: false, // If you want interim results, set this to true
};
// Create a recognize stream
const recognizeStream = client
.streamingRecognize(request)
.on('error', console.error)
.on('data', data =>
process.stdout.write(
data.results[0] && data.results[0].alternatives[0]
? `Transcription: ${data.results[0].alternatives[0].transcript}\n`
: `\n\nReached transcription time limit, press Ctrl+C\n`
)
);
// Start recording and send the microphone input to the Speech API
record
.start({
sampleRateHertz: sampleRateHertz,
threshold: 0,
// Other options, see https://www.npmjs.com/package/node-record-lpcm16#options
verbose: false,
recordProgram: 'sox', // Try also "arecord" or "sox"
silence: '10.0',
})
.on('error', console.error)
.pipe(recognizeStream);
console.log('Listening, press Ctrl+C to stop.');
}
}
}
</script>
Я понимаю, что, поскольку я заставил это работать в самом NodeJS, я мог бы использовать отдельный сервер NodeJS, связанный с приложением электронов, и обмениваться данными через веб-сокет, но я хочу сделать его максимально простым для конечного пользователя.Заранее спасибо.