Мониторинг работ или выявление узких мест в конвейере данных - PullRequest
0 голосов
/ 09 мая 2018

Я использую Google Cloud DataFow.Некоторые из моих конвейеров данных должны быть оптимизированы.Мне нужно понять, как работники работают в кластере потока данных на этих линиях.1. Сколько памяти используется?В настоящее время я регистрирую использование памяти, используя код Java.2. Есть ли узкое место на дисковых операциях?Чтобы понять, нужен ли SSD?3. Есть ли узкое место в Vcpus?Чтобы увеличить Vcpus в рабочих узлах.

Я знаю, что драйвер стека может использоваться для мониторинга использования процессора и дисков в кластере.Однако он не предоставляет информацию об отдельных работниках, а также о том, не попадаем ли мы в них.

1 Ответ

0 голосов
/ 09 мая 2018

В пользовательском интерфейсе Dataflow Stackdriver вы правы, вы не можете просматривать показатели отдельных работников. Тем не менее, вы, безусловно, можете установить Панель инструментов Stackdriver , которая дает вам индивидуальные рабочие метрики для всего того, что вы упомянули. Ниже приведен пример панели инструментов, на которой отображаются показатели для ЦП, памяти, сети, операций чтения IOP и записи IOPS.

Stackdriver Dashboard

Поскольку имя задания Dataflow будет частью имени экземпляра GCE, здесь я отфильтровываю экземпляры GCE, отслеживаемые по интересующему меня имени задания. В этом случае мое задание Dataflow было названо «pubsub-to-». bigquery ", поэтому я отфильтровал до instance_name ~= pubsub-to-bigquery.*. Я сделал фильтр регулярных выражений, чтобы быть уверенным, что захватил любые имена заданий, которые могут быть дополнены дополнительными данными в будущих прогонах. Подобная настройка панели мониторинга может сообщить вам, когда вы действительно выиграете от использования твердотельных накопителей, большей пропускной способности сети и т. Д.

Также не забудьте проверить график задания потока данных в облачной консоли при поиске оптимизации вашего конвейера. Время перехода под именем шага может дать хорошее представление о том, какие пользовательские преобразования или dofns должны быть предназначены для оптимизации.

...