Я реализую распределенное приложение глубокого обучения с использованием Tensorflow 2.1.0 на хороводе. Я хочу профилировать время вычислений и время связи для каждого шага соответственно. Как я могу получить эту информацию о профилировании во время выполнения?