У меня есть кластер Kubernetes, выполняющий распределенную (параллельную) обработку данных, которая записывает результаты в БД.
Я сталкиваюсь с тем, что кажется ограничением для моего параллелизма из-за ограничения производительности сети по БД.
Однако мне сказали исследовать кластер , то есть убедиться, что мои 1000+ модулей в моем кластере действительно обеспечивают высокий уровень пропускной способности и ограничены способностью БДполучить эти данные.
Каковы некоторые рекомендуемые способы мониторинга пропускной способности сети кластера Kubernetes (или производительности сети)?
Для мониторинга потребления ЦП и памяти я использую Heapster в инструментальной панели Kubernetes, и это нормально,
Для моей рабочей нагрузки, которая является высокопараллельной , я нахожу проблемы с сетью наиболее распространенными (то есть мои узлы имеют более чем достаточно ресурсов ЦП и памяти, но я подозреваю, что недостаточно пропускной способности сети для записивсе эти данные успешно отправляются в БД).
Я проверил несколько статей, таких как this , но, похоже, он охватывает проблемы с подключением (достижимость), но не для мониторинга объема трафика кластера во всей его полноте.
Я действительно ищу что-то, что показывает мне, что "все ваши блоки генерируют X объем сетевого трафика", если это возможно.