Google речь к тексту API результат пуст - PullRequest
0 голосов
/ 13 ноября 2018

Я использую Cloud speech to text api для конвертации аудио файла в текстовый файл. Я выполняю его с помощью Python, ниже приведен код.

import io
import os

os.environ["GOOGLE_APPLICATION_CREDENTIALS"]="D:\\Sentiment_Analysis\\My Project 59503-717155d6fb4a.json"

# Imports the Google Cloud client library
from google.cloud import speech
from google.cloud.speech import enums
from google.cloud.speech import types

# Instantiates a client
client = speech.SpeechClient()

# The name of the audio file to transcribe
file_name = os.path.join(os.path.dirname('D:\CallADoc_VoiceImplementation\audioclip154173607416598.amr'),'CallADoc_VoiceImplementation','audioclip154173607416598.amr')

# Loads the audio into memory
with io.open(file_name, 'rb') as audio_file: content = audio_file.read()
audio = types.RecognitionAudio(content=content)

config = types.RecognitionConfig(encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,sample_rate_hertz=16000,language_code='en-IN')

# Detects speech in the audio file
response = client.recognize(config, audio)

for result in response.results: print('Transcript: {}'.format(result.alternatives[0].transcript))

Когда я выполняю образец / проверенный аудиофайл с именем «audio.raw», звук конвертируется, и результат выглядит следующим образом.

runfile('C:/Users/sandesh.p/CallADoc/GoogleSpeechtoText.py', wdir='C:/Users/sandesh.p/CallADoc')
Transcript: how old is the Brooklyn Bridge

Но для того же кода я записываю аудио и пытаюсь конвертировать, он дает пустой результат, как показано ниже:

runfile('C:/Users/sandesh.p/CallADoc/GoogleSpeechtoText.py', wdir='C:/Users/sandesh.p/CallADoc')

Я пытаюсь исправить это за последние 2 дня, и, пожалуйста, помогите мне решить эту проблему.

1 Ответ

0 голосов
/ 14 ноября 2018

Попробуйте выполнить действия по устранению неполадок , чтобы получить звук с соответствующими настройками.

Например, ваш аудиофайл будет иметь следующие настройки, которые должны иметь лучшие результаты:

Encoding: FLAC
Channels: 1 @ 16-bit
Sampleratehertz: 16000Hz
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...