Трудно сказать без подробностей.Однако, по моему опыту, если все ваши данные в SQL, чем ваш движок SQL, вероятно, имеет больше оптимизаций, чем простое сокращение карты.
Не зная, что именно вы хотите обработать, и состояния данных, тогда, если вы не столкнетесь с каким-то серьезным крайним случаем в вашей среде, у вас, вероятно, будет больше проблем с настройкой и использованием hadoop в вашем случае, и этовероятно, не займет много времени.
Если все ваши данные в Oracle, они, вероятно, все проанализированы, проиндексированы и, как мы надеемся, несколько регулярны.Если хрущ существует полностью в этом домене (и вы не пытаетесь работать с чем-то необычным, например, с большими BLOB-объектами или другими странными ситуациями), в большинстве случаев лучше позволить вашему ядру базы данных справиться с этим.
Мораль истории:
Hadoop действительно потрясающий, но он не магический и не делает обычный старый SQL быстрее!