Существуют ли какие-либо инструменты / языки, которые позволяют ученым избегать переноса огромных наборов данных с одного сервера на другой для статистического анализа и анализа машинного обучения, а вместо этого запускать анализ на месте для таблицы данных в хранилище данных?
Мне известны облачные сервисы, такие как Azure и AWS, - но здесь я спрашиваю, есть ли какие-либо ярлыки для перемещения данных без существенных изменений инфраструктуры (например, язык статистического программирования, который может быть непосредственно установлен на нашем DW).