DeepSpeech дает плохие результаты - PullRequest
1 голос
/ 10 февраля 2020

Я новичок в DeepSpeech. Я перешел по этой ссылке , чтобы создать речевой текстовый код, но мои результаты не так близки к исходной речи. Я использую Deepspeech 0.6.1 и установил соответствующую предварительно подготовленную модель. Я использую эту ссылку для создания моего файла WAV с параметрами по умолчанию. Ниже мой код.

import numpy as np
import wave
from deepspeech import Model
from scipy.io import wavfile as wav
import speech_recognition as sr

audio_file = "D:/Dataset/DeepSpeech/converted_stt1.wav"
ds = Model('D:/Dataset/DeepSpeech/deepspeech-0.6.1-models/models/output_graph.pbmm',500)
ds.enableDecoderWithLM('D:/Dataset/DeepSpeech/deepspeech-0.6.1-models/models/lm.binary','D:/Dataset/DeepSpeech/deepspeech-0.6.1-models/models/trie', 0.75, 1.85)
rate, audio = wav.read(audio_file)
print(audio)
transcript =ds.stt(audio)
print(transcript)

Я подозреваю, что эта проблема из-за моего аудио формата или что-то. Пожалуйста, помогите мне с этой проблемой, как я могу максимально использовать библиотеку глубокой речи.

1 Ответ

1 голос
/ 27 февраля 2020

Я также использую Deepspeech v0.6.1

Одна вещь, которую я заметил, это проблема с

from scipy.io import wavfile as wav 

Поскольку, когда я запускал тот же файл, используя client.py, предоставленный результатом Mozilla Deepspeech изменить

ссылка на файл клиента client.py

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...