Существуют ли какие-либо проекты, в которых применяются методы управляемой моделями инженерии для Map-Reduce и файловой системы Hadoop (и / или производных)?
В идеале мне нужен способ развертывания существующей модели данных поверхHDFS (и, конечно, его запросы) и язык, который поддерживает работу с этими объектами через Map-Reduce.
Это может быть что-то вроде препроцессора, который сканирует программу, выраженную на установленном языке (например, Python илиC ++) и выводит набор файлов, готовых к развертыванию в кластере Map-Reduce для выполнения.
Если чего-то подобного не существует, есть ли что-нибудь, что могло бы приблизить меня как можно ближе, используя (предпочтительно)Python?