Adhoc Обработка данных / ETL - PullRequest
1 голос
/ 26 мая 2009

Я только начал работать в новой компании по аутсорсингу коммуникаций (например, печать и почта, электронная почта, факс). Одним из требований является обработка данных клиентов и подготовка их к отправке по почте.

Для повторяющихся работ это легко с помощью инструмента ETL, связанного с некоторым программным обеспечением для адресации, но для специальных вещей это немного излишне. Я раньше использовал собственные разработанные вещи (неуклюжие, но пригодные для использования), но я не хочу пересматривать это здесь. Любые рекомендации?

Некоторые функции:

  • Базовая функциональность СУБД (желательно с соответствующим бэкэндом СУБД для поддержки SQL)
  • Объединение полей (например, объединение имени + фамилии)
  • «Перемещение столбцов» (например, с адресными полями 1–8, сдвинуть их влево, чтобы, если один из них пуст, следующий был перемещен вверх)
  • Сортировка почты в Австралии по почте и распределение dpid (или может относительно легко ссылаться на внешние инструменты)

1 Ответ

1 голос
/ 19 июня 2009

Будет ли приемлемо использование собственного Python или Perl?

...