как получить отметку времени каждого слова в кармане - PullRequest
0 голосов
/ 01 ноября 2019

, поэтому я пытаюсь запрограммировать какое-нибудь программное обеспечение для распознавания речи, используя карманный сфинкс, и я пытаюсь получить временную метку каждого слова (когда слово начинается в аудиофайле и когда оно заканчивается), и я пытался найти решениев Интернете, и я еще не нашел один, так что если кто-то мог помочь, это было бы здорово !!

это мой код до сих пор

from pocketsphinx import *
import speech_recognition as sr
from os import environ, path
from pocketsphinx.pocketsphinx import *
from sphinxbase.sphinxbase import *
from pocketsphinx import AudioFile


fps = 100


r = sr.Recognizer()
with sr.Microphone() as source:
    print("Say Anything :")
    audio = r.listen(source)


try:
 print("Sphinx thinks you said " + r.recognize_sphinx(audio))
 with open("speech.wav", "wb") as f:
  f.write(audio.get_wav_data())
except sr.UnknownValueError:
    print("Sphinx could not understand audio")
    with open("speech.wav", "wb") as f:
     f.write(audio.get_wav_data())
except sr.RequestError as e:
    print("Sphinx error; {0}".format(e))


for phrase in AudioFile(frate=fps):  # frate (default=100)
    print('-' * 28)
    print('| %5s |  %3s  |   %4s   |' % ('start', 'end', 'word'))
    print('-' * 28)
    for s in phrase.seg():
        print('| %4ss | %4ss | %8s |' % (s.start_frame / fps, s.end_frame / fps, s.word))
    print('-' * 28)

Я пытаюсь получить отметку времени того, что я говорю, и, похоже, нет документации по этому вопросу

...