Я генерирую речь через API преобразования текста в речь Google Cloud, и я хотел бы выделить слова по мере их произнесения.
Есть ли способ получить метки времени для произнесенных слов или предложений?