Sqoop может быть хорошим способом, но его сложно настроить (IMHO), так как все эти проекты, связанные с Hadoop ...
DBStorage Pig работает нормально (по крайней мере для хранения).
Не забудьте зарегистрировать PiggyBank и ваш драйвер MySQL:
-- Register Piggy bank
REGISTER /opt/cmr/pig/pig-0.10.0/lib/piggybank.jar;
-- Register MySQL driver
REGISTER /opt/cmr/mysql/drivers/mysql-connector-java-5.1.15-bin.jar
Вот пример вызова:
-- Store a relation into a SQL table
STORE relation INTO 'unused' USING org.apache.pig.piggybank.storage.DBStorage('com.mysql.jdbc.Driver', 'jdbc:mysql://<mysqlserver>/<database>', '<login>', '<password>', 'REPLACE INTO <table> (<column1>, <column2>) VALUES (?, ?)');