Чтение данных в любом формате, запись в таблицу - PullRequest
0 голосов
/ 02 марта 2012

Мне было интересно, кто-нибудь когда-нибудь слышал о каком-либо инструменте (с открытым исходным кодом), который считывает данные в нескольких форматах (CSV, XML, таблицы базы данных и т. Д.) И нормализует их в единый формат (например, таблицу Oracle или безотносительно)

Например, у нас есть клиенты, которые отправляют нам финансовые данные, и я надеялся, что есть что-то, что я мог бы использовать и внести свой вклад.

Ответы [ 2 ]

1 голос
/ 02 марта 2012

Не уверен, но ETL может быть тем, что вы ищете: http://en.wikipedia.org/wiki/Extract,_transform,_load

1 голос
/ 02 марта 2012

Я использую Kettle (он же Pentaho Data Integration) для этого (и многих других вещей, подделывающих данные).

Это открытый исходный код (раньше он был LGPL, недавно переведен на лицензию Apache 2.0) и поддерживает многие входные форматы (JSON, CSV, LDAP, XML, Excel и т. Д.) И многие базы данных (+30 из коробка)

Учебник: http://wiki.pentaho.com/display/EAI/Pentaho+Data+Integration+(Kettle)+Tutorial Загрузить: http://sourceforge.net/projects/pentaho/files/Data%20Integration/

(Вам понадобится Java 6)

...