Существуют ли какие-либо решения для агрегации пакетных файлов журналов? - PullRequest
7 голосов
/ 01 марта 2010

Я хочу экспортировать из нескольких узлов файлы журналов (в моем случае доступ к Apache и журналы ошибок) и объединять эти данные в пакетном режиме, как запланированное задание. Я видел несколько решений, которые работают с потоковыми данными (то есть, думаю, писец). Я хотел бы инструмент, который дает мне гибкость, чтобы определить пункт назначения. Это требование связано с тем, что я хочу использовать HDFS в качестве места назначения.

Мне не удалось найти инструмент, поддерживающий это в пакетном режиме. Перед тем, как заново создать колесо, я хотел бы попросить сообщество StackOverflow высказать свое мнение.

Если в Python уже есть решение, это было бы еще лучше.

Ответы [ 4 ]

1 голос
/ 31 июля 2010

мы используем http://mergelog.sourceforge.net/ для объединения всех наших журналов apache ..

0 голосов
/ 01 апреля 2010

взгляните на Zomhg, систему агрегации / отчетности для файлов журналов, использующую Hbase и Hdfs: http://github.com/zohmg/zohmg

0 голосов
/ 23 июня 2010

Scribe может удовлетворить ваши требования, есть версия ( link ) scribe, которая может объединять журналы из нескольких источников, и после достижения заданного порога она сохраняет все в HDFS. Я использовал это, и это работает очень хорошо. Компиляция довольно сложная, поэтому, если у вас возникнут проблемы, задайте вопрос.

0 голосов
/ 06 марта 2010

PiCloud может помочь.

Платформа PiCloud дает вам свободу в разработке ваших алгоритмов и программное обеспечение, не тратя время на все, что приходит с предоставлением, управлением и обслуживанием серверов.

...