Я использую приложение Voice-to-Text, которое выдает файлы транскрипции в качестве вывода .. Транскрибированный текст содержит несколько тегов, таких как (s)
(для начала предложения) .. (/s)
(для конца предложения) .. (VOCAL_NOISE)
(для нераспознанных слов) .. но текст также содержит нежелательные теги, такие как (VOCAL_N)
, (VOCAL_NOISED)
, (VOCAL_SOUND)
, (UNKNOWN)
.. Я использую SED для обработки текста .. но не могу написать соответствующее регулярное выражение для замены всех других тегов, кроме (s)
, (/s)
и (VOCAL_NOISE)
, на тег ~NS
.. будет признателен, если кто-нибудь сможет мне помочь с этим ..
Пример текста:
(s) Hi Stacey , this is Stanley (/s) (s) I would (VOCAL_N) appreciate if you could call (UNKNOWN) and let him know I want an appointment (VOCAL_NOISE) with him (/s)
Вывод должен быть:
(s) Hi Stacey , this is Stanley (/s) (s) I would ~NS appreciate if you could call ~NS and let him know I want an appointment (VOCAL_NOISE) with him (/s)