Как я могу получить смещение и длительность цензурированных слов (ненормативную лексику) в аудиофайле с помощью Azure Speech to Text Services с использованием Python? Я вижу, что ругательства в преобразованном тексте помечены звездочкой и имеют ту же длину, что и произнесенные слова. Я хотел получить временную метку, в которой произносятся ругательства, чтобы я мог использовать эту информацию для таких действий, как отключение звука.