Является ли Pentaho ETL и Data Analyzer хорошим выбором? - PullRequest
5 голосов
/ 27 ноября 2009

Я искал инструмент ETL и в гугле нашел много о Pentaho Kettle.

Мне также нужен анализатор данных для запуска на схеме Star, чтобы бизнес-пользователь мог поиграть и сгенерировать любой вид отчета или матрицы. И снова PentaHo Analyzer выглядит хорошо.

Другая часть приложения будет разработана на Java, и приложение должно быть независимым от базы данных.

Достаточно ли хорош Пентахо или есть другие инструменты, которые я должен проверить.

Ответы [ 4 ]

3 голосов
/ 29 ноября 2009

Pentaho выглядит довольно солидно, предлагая полный набор инструментов BI с улучшенной интеграцией, как сообщается, в процессе. Но ... есть вероятность, что компании, желающие пойти по пути с открытым исходным кодом для своего решения BI, также, скорее всего, в конечном итоге будут использовать технологию баз данных с открытым исходным кодом ... и в , что означает, что "независимость от базы данных" может легко быть обоюдоострым мечом. Например, вы можете разработать куб в службах аналитики Microsoft, хорошо понимая, что все MDX / XMLA, которые ваш куб отправляет в базу данных, будут последовательно интерпретироваться, что будет препятствовать неприятным сюрпризам.

Сравните это со стеком Pentaho, который обычно заканчивается взаимодействием с Postgresql или Mysql. Я не могу ручаться за то, как Postgresql работает в области OLAP, но из опыта знаю, что Mysql - при всех его несомненных достоинствах - имеет «проблемы» с типами SQL, которые обычно возникают повсеместно в решении OLAP (Вы не можете продвинуться далеко в кубе без использования GROUP BY или COUNT DISTINCT). Таким образом, часть того, что вы сэкономите на стоимости лицензий, почти наверняка будет использована для решения вопросов, возникающих из-за того, что Пентахо не всегда знает, с какой базой данных он разговаривает - грабя Питера (по крайней мере, частично), чтобы заплатить Павлу, так сказать.

1 голос
/ 02 декабря 2009

К сожалению, требуется больше информации. Например:

  • Вам нужно будет обмениваться данными с известными приложениями (Oracle Financials, Remedy и т. Д.)? Если это так, вы можете сэкономить массу времени и денег с помощью решения ETL, которое уже поддерживает встроенный интерфейс.
  • с какими продуктами баз данных (и версиями) и типами файлов вам нужно общаться?
  • нужно ли поддерживать запросы к веб-сервисам?
  • Вам нужен поток данных почти в реальном времени?
  • нужен ли вам аудит на уровне правил и счета для учета каждой отдельной строки
  • Вам нужна дельта-обработка?
  • На каких машинах вам это нужно? линукс? окна? мэйнфреймы?
  • Каким процессам контроля версий, тестирования и сборки будет соответствовать этот инструмент?
  • какая производительность и масштабируемость вам нужна?
  • Вы не возражаете, если база данных завершит преобразование?
  • Вам это нужно для запуска в пользовательском пространстве?
  • вам нужно запускать его части в разных сетях, отключенных от остальных? (не редкость для процессов извлечения)
  • сколько интерфейсов и какой сложности вам нужно поддерживать?

Вы можете потратить много времени на развертывание и изучение инструмента ETL - только чтобы обнаружить, что он действительно не очень хорошо соответствует вашим потребностям. Лучше всего сначала пару часов, чтобы понять это.

0 голосов
/ 20 февраля 2013

Есть много вариантов. Посмотрите на BIRT, Talend и Pentaho, если вам нужны бесплатные инструменты. Если вы хотите гораздо большей надежности, посмотрите на Tableau и BIRT Analytics.

0 голосов
/ 27 ноября 2009

Я использовал Talend раньше с некоторым успехом. Вы создаете свой перевод, объединяя операции в графическом дизайнере. Определенно было несколько WTF, и было трудно иметь дело с многострочными записями, но в противном случае это работало хорошо.

Talend также генерирует Java, и вы можете получить доступ к процессам ETL удаленно. Этот инструмент также бесплатный, хотя он обеспечивает обучение и поддержку на предприятии.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...