Для API Scala поверх Hadoop посмотрите Scoobi , он все еще находится в тяжелой разработке, но многообещающе. Также предпринимаются некоторые усилия для реализации распределенных коллекций поверх hadoop в инкубаторе Scala , но это усилие пока не используется.
Существует также новая оболочка для каскадирования от Twitter, которая называется Scalding .
После очень краткого изучения документации для Scalding кажется,
что в то время как это делает интеграцию с каскадированием более гладкой, она все же делает
Не решить, что я вижу в качестве основной проблемы с каскадированием: безопасность типов.
Каждая операция каскадирования работает с кортежами каскадирования (в основном
список значений поля с отдельной схемой или без нее), что означает, что
ошибки типа, т.е. Соединение ключа в виде строки и ключа в качестве длинного отведения
к сбоям во время выполнения.