Я использую Google API для преобразования текста в текст.
ниже мой код Python:
from google.cloud import speech_v1p1beta1 as speech
import os
os.environ["GOOGLE_APPLICATION_CREDENTIALS"]="C:\\Users\\chetan.patil\\Speech Recognition-db71b5de7c80.json" #Specified key
client=speech.SpeechClient()
speech_file="Chetan_Recording_20Secflac.flac" #import file
with open(speech_file,'rb') as audio_file:
content=audio_file.read()
audio=speech.types.RecognitionAudio(content=content)
config=speech.types.RecognitionConfig(encoding=speech.enums.RecognitionConfig.AudioEncoding.LINEAR16,
language_code='en_US',enable_speaker_diarization=True,audio_channel_count=1,
sample_rate_hertz=44100)
response = client.recognize(config, audio)
Когда я запускаю последний код строки. Выдает ошибку «400 Укажите кодировку FLAC для соответствия заголовку файла»
Даже если я попытался с WAV-файлом, то выдает ошибку «400 Должен использовать одноканальный (моно) звук, но заголовок WAV указывает на 2 канала»
Может кто-нибудь помочь мне в этом?