Каковы преимущества использования CouchDB против Hadoop для хранения / анализа данных журнала веб-приложения? - PullRequest
3 голосов
/ 02 марта 2011

Я хочу отказаться от использования простых файлов журналов Rails для своих веб-приложений, чтобы я мог анализировать просмотры страниц и шаблоны использования.Я слышал, что CouchDB иногда используется для этого.

С другой стороны, я знаю людей, которые просто подают файлы журнала в виде простого текста в Hadoop и сокращают их до сводной статистики, которую они затем вставляют в MySQL.

Каковы плюсы и минусы каждого из этих двух методов регистрации и анализа файлов журнала?

1 Ответ

7 голосов
/ 02 марта 2011

Я могу говорить только за CouchDB, но основные преимущества использования базы данных документов для хранения подобных вещей:

  • Они не содержат схемы, поэтому вы можете изменять схему записей журнала и выполнять запросы к различным редакциям схемы, которые могут у вас быть.
  • Алгоритм отображения / уменьшения - очень мощный способ группирования запросов.
  • Интерфейс REST делает его независимым от технологии с точки зрения потребления данных.
  • Масштабирование горизонтальное и «бесконечное».
...