Мне нравится потоковое вещание Hadoop за его способность быстро выкачивать, а грязные - уменьшать количество рабочих мест. Я также люблю Hroovy за то, что я сделал все мои тщательно закодированные Java доступными для скриптового языка. Теперь я хотел бы собрать 2 вместе. Я хотел бы взять банку с некоторыми из моих классов Java, и использовать их в основанных на Groovy картографов и редукторов.
Есть ли простой способ сделать это? Похоже, что это может привести к значительному сокращению времени разработки задач по уменьшению карт, особенно тех, которые я собираюсь запустить несколько раз.
я хотел бы сделать что-то вроде:
hadoop jar streaming.jar -mapper "groovy -ne 'import a.b.c.Foo; println Foo.doSomething(line)' -reducer "wc -l" -input input -output output -jarstoinclude ~/jarWithJava.jar
какие-нибудь указатели, как это сделать?