Переписать аудио файл в Python - PullRequest
0 голосов
/ 14 февраля 2019

Я пытаюсь расшифровать аудиофайл, который является немного большим.Его свойства следующие:

Size : 278.3 MB
Duration : 52 minutes
Format : WAV

Follwoing - мой код, который я использовал для его преобразования с продолжительностью 60 секунд.Не могли бы вы посоветовать записать этот файл сразу?

import speech_recognition as sr

r = sr.Recognizer()
with sr.AudioFile('sampleMp3.WAV') as source:
    audio = r.record(source, duration=60) 

command = r.recognize_google(audio)

text_file = open("Output.txt", "w")
text_file.write(command)
text_file.close()

1 Ответ

0 голосов
/ 15 февраля 2019

пакет python для speech_recognition - это просто оболочка, она не предоставляет даже базовых функций.

Если вы хотите использовать Google Speech API (платный), вы можете сделать что-то вроде этого:

https://github.com/GoogleCloudPlatform/python-docs-samples/blob/master/speech/cloud-client/transcribe_async.py

Если вы хотите рассмотреть Bing, он также предоставляетпохожий API, см. Как я могу транскрибировать речевой файл с Bing Speech API в Python?

В качестве бесплатной альтернативы рассмотрите https://github.com/alumae/kaldi-offline-transcriber

...