, поэтому я пытаюсь запрограммировать какое-нибудь программное обеспечение для распознавания речи, используя карманный сфинкс, и я пытаюсь получить временную метку каждого слова (когда слово начинается в аудиофайле и когда оно заканчивается), и я пытался найти решениев Интернете, и я еще не нашел один, так что если кто-то мог помочь, это было бы здорово !!
это мой код до сих пор
from pocketsphinx import *
import speech_recognition as sr
from os import environ, path
from pocketsphinx.pocketsphinx import *
from sphinxbase.sphinxbase import *
from pocketsphinx import AudioFile
fps = 100
r = sr.Recognizer()
with sr.Microphone() as source:
print("Say Anything :")
audio = r.listen(source)
try:
print("Sphinx thinks you said " + r.recognize_sphinx(audio))
with open("speech.wav", "wb") as f:
f.write(audio.get_wav_data())
except sr.UnknownValueError:
print("Sphinx could not understand audio")
with open("speech.wav", "wb") as f:
f.write(audio.get_wav_data())
except sr.RequestError as e:
print("Sphinx error; {0}".format(e))
for phrase in AudioFile(frate=fps): # frate (default=100)
print('-' * 28)
print('| %5s | %3s | %4s |' % ('start', 'end', 'word'))
print('-' * 28)
for s in phrase.seg():
print('| %4ss | %4ss | %8s |' % (s.start_frame / fps, s.end_frame / fps, s.word))
print('-' * 28)
Я пытаюсь получить отметку времени того, что я говорю, и, похоже, нет документации по этому вопросу