Вы можете выровнять набор данных по времени, например, TEDLIUM, со временными метками слова и рассчитать из него скорость речи.
Если вам нужны разнообразные скорости, вероятно, лучше выгрузить youtube aud ios и использовать распознанные временные метки слова, поскольку большинство наборов данных довольно единообразны по скорости.