Какие шаги я должен предпринять, чтобы построить проект по науке о данных с нуля? - PullRequest
0 голосов
/ 11 июля 2019

моя компания создает команду по науке о данных, пока я единственный.У меня есть некоторый опыт машинного обучения, но все было сделано на месте.Теперь мне нужно построить проект с использованием облака Google, и вопрос в следующем: с чего мне начать?

  • Определить архитектуру обработки данных?Который из?Лямбда или каппа например ..
  • Должен ли я использовать Apache Beam с Dataflow?Каковы некоторые общие подходы?
  • Что мне делать дальше?

Так что я ищу человека, который испытал это раньше и мог бы помочь мне рассказать, какие шаги я должен предпринять.

Я пытался использовать Cloud Dataprep и Big Query.Часть, посвященная машинному обучению, которую я проделал с созданным экземпляром ноутбука Jupyter на вычислительном движке.

Заранее спасибо.

...