Масштабирование Google Cloud ML Engine с онлайн-прогнозами.Как измерить загрузку узла? - PullRequest
0 голосов
/ 08 февраля 2019

У меня есть модель Inception V3 с некоторыми изменениями ввода и вывода, развернутыми в Google Cloud ML Engine для онлайн-прогнозов.В течение недели или около того у меня было относительно немного редких запросов (около 130) со средней задержкой около 100 мс и 95% процентили 2000 мс.Я уже сгенерировал около 2 узлов * часов.Минимальное количество узлов установлено в 0. Это первый раз, когда я хочу использовать Cloud ML Engine в работе.

Вопросы:

Я знаю, что узлы работают через несколько минут после запроса.Но как я могу оценить количество запросов, скажем, за 1 минуту, которое приведет к масштабированию системы?Похоже, что нет никакой информации об использовании процессором узлов.

В моем случае я предполагаю, что количество запросов будет неуклонно расти.Стоит ли ожидать, что число узлов * достигнет приблизительно 30 * 24 (количество дней в часах в месяце), затем насыщать это значение в течение некоторого времени, а затем идти дальше, когда загрузка ЦП узлов предсказания достигает, скажем, 70%?

Ответы [ 2 ]

0 голосов
/ 10 февраля 2019

Мы публикуем журналы уровня запросов на Stackdriver.Вы можете включить их, создав модель с online_prediction_logging = True.В этих журналах у нас есть поле с именем loading_request, которое может сообщить вам, попал ли этот запрос на новый компьютер.Для данного более короткого периода времени это может дать вам приблизительную оценку количества задействованных узлов.Для более точного масштабирования узла должна помочь функция, предложенная rhaertel80.

0 голосов
/ 08 февраля 2019

Скоро вы сможете отслеживать количество используемых узлов, но пока не можете этого сделать.Вы можете сделать быструю и грубую оценку, основанную на вашем среднем значении в секунду и времени ожидания.Предположим, что использование составляет приблизительно 60%, тогда:

X qps * .2 secs/query / .6
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...