преобразование автоматической записи голоса в текст с использованием Python - PullRequest
0 голосов
/ 07 июня 2018

Вариант использования : я положил телефон на динамик, набрал номер службы поддержки клиентов, записал автоматическое голосовое сообщение на своем ноутбуке, теперь я хочу преобразовать его в текст.

Что я делал до сих пор?

Я пробовал с библиотекой распознавания речи в python

import speech_recognition as sr 
import time 
r=sr.Recognizer()

#This block will help in recognising audio file harvard = sr.AudioFile('voice1.wav') with harvard as source:
    r.adjust_for_ambient_noise(source)
    audio = r.record(source,offset=0, duration=5)

print r.recognize_google(audio, show_all=True)

Однако текст не возвращается.

1 Ответ

0 голосов
/ 15 ноября 2018

Извините за поздний ответ.Я создал виртуального помощника с помощью Google Speech API.Оказывается, основная проблема связана с порогом микрофон .Попробуйте поиграть с порогом . Потому что, когда вы записываете поток в режиме реального времени, попробуйте сохранить его и прослушать его локально.В функции микрофона есть параметр, который является пороговым значением, попробуйте изменить его, потому что по умолчанию настраивается довольно плохо, если микрофон встроен.

Google речевой API может быть заблокирован (но он работает для меня, хотя яне использую токен).Хотя предпочтительным вариантом является использование токенов в Google API (речь в текст), хотя текст возвращается в идеальном виде.Проверьте документацию распознавания речи.Также есть множество других API.

...