Мне нужно немного советов по археологии.У меня есть веб-приложение на основе Java, с ORM на основе JPA, резервное копирование в реляционную базу данных MySQL.Теперь, как часть приложения, у меня есть пакетное задание, которое сравнивает тысячи записей базы данных друг с другом.Эта работа стала слишком трудоемкой и должна быть распараллелена.Я смотрю на использование mapreduce и hadoop для того, чтобы сделать это.Однако я не слишком уверен, как интегрировать это в мою текущую архитектуру.Я думаю, что самое простое первоначальное решение - найти способ перенести данные из mysql в задания hadoop.Я провел некоторые начальные исследования по этому вопросу и обнаружил следующую соответствующую информацию и возможности:
1) https://issues.apache.org/jira/browse/HADOOP-2536, это дает интересный обзор некоторой встроенной поддержки JDBC 2) Эта статья http://architects.dzone.com/articles/tools-moving-sql-database описывает некоторые сторонние инструменты для перемещения данных из mysql в hadoop.
Если честно, я только начинаю с изучения hbase и hadoop, но я действительно не знаю, как интегрировать это в мое веб-приложение.
Любой совет с благодарностью.ура, Брайан