Я строю классификационную модель с использованием AutoML и у меня есть несколько базовых c вопросов об использовании GCP.
1 - Вопрос о конфиденциальности данных; если мы сохраним данные о поведении для обучения нашей модели в BigQuery, будет ли Google иметь доступ к этим данным? Может ли Google когда-либо использовать эти данные, чтобы узнать больше о поведении людей, с которых мы собирали данные?
2 - Поскольку затраты на обучение взимаются с каждым часом, я хотел бы понять взаимосвязь между данными и временем обучения. Время линейно увеличивается с размером набора обучающих данных? Например, мы обучили классификации, используя 1,7 МБ данных, и это заняло 3 часа. Итак, заняло бы обучение модели с 17 МБ данных 30 часов?
3 - прогнозирование партии стоит 1,16 доллара в час. Тем не менее, наши данные находятся в CSV, и кажется, что мы не можем загрузить CSV, чтобы сделать пакетный прогноз. Итак, мы попробуем использовать API. Поэтому у меня есть два вопроса: A) можем ли мы выполнить пакетную загрузку с использованием API и B) каковы связанные с этим расходы?
4 - Что такое онлайн-прогноз?
5 - Когда с помощью калькулятора затрат (для машинного обучения), что такое час узла?