Есть ли способ удалить определенные ключевые слова, такие как электронная почта, номера телефонов из аудиофайла (.wav), не преобразовывая его в текст? - PullRequest
1 голос
/ 25 июня 2019

У меня есть аудиофайл с информацией, такой как электронная почта, номера телефонов и т. Д. Я хочу удалить такую ​​информацию без потери оригинального голоса.

Я использовал следующий подход с python:

  1. Сначала я преобразовал аудио в текст, а затем удалил те информацию и снова преобразовал ее в аудио.
  2. Таким образом, я потерял первоначальный голос человека.

Есть ли способ, которым я могу достичь этого без потери оригинального голоса? Это код, который я использовал для преобразования аудио в текст с помощью Azure API.

def stream_audio_file(speech_file, chunk_size=1024):
    # chunk audio file
    with open(speech_file, 'rb') as f:
        while 1:
            data = f.read(1024)
            if not data:
                break
            yield data

Как удалить некоторую информацию из аудио, не теряя оригинального голоса?

1 Ответ

0 голосов
/ 25 июня 2019

Получите метки времени слова из распознавателя и удалите сигнал в требуемые периоды. Проверьте «AddWordLevelTimestamps» параметр конфигурации.

...