GCP Dataflow vCPU вопрос об использовании и цене - PullRequest
0 голосов
/ 23 октября 2018

Я отправил конвейер потока данных GCP, чтобы получить мои данные из GCP Pub / Sub, проанализировать и сохранить их в GCP Datastore.Кажется, что работа отлично.

Через 21 день я обнаружил, что стоимость составляет 144,54 доллара, а рабочее время - 2094,72 часа.Это означает, что после того, как я отправил его, он будет заряжаться каждую секунду, даже если он не получает (обрабатывает) какие-либо данные из Pub / Sub.

Это нормальное поведение?Или я установил неправильные параметры?Я думал, что время использования процессора будет учитываться только при получении данных.

Есть ли способ уменьшить стоимость в той же рабочей модели (получить из Pub / Sub и сохранить в Datastore)?

1 Ответ

0 голосов
/ 23 октября 2018

Служба облачных потоков данных использование оплачивается с шагом в секунду, на основе задания.Я предполагаю, что ваша работа использовала 4 рабочих n1-стандарта-1, которые использовали 4 виртуальных ЦП, что дает приблизительно 2000 виртуальных ЦП в час использование ресурсов .Поэтому такое поведение нормальное.Чтобы снизить стоимость, вы можете использовать autoscaling , чтобы указать максимальное количество рабочих, или параметры конвейера , чтобы переопределить параметры ресурсов, которые выделены для каждого работника.В зависимости от ваших потребностей, вы можете рассмотреть возможность использования облачных функций , которые стоят дешевле , но с учетом его ограничений .

Надеюсь, это поможет.

...