Каков наилучший способ хранить и экспортировать данные потока кликов практически в режиме реального времени - PullRequest
2 голосов
/ 07 апреля 2011

Допустим, у меня есть веб-сайт, который получает много просмотров.Мне нужно хранить данные о кликах в какой-либо базе данных, чтобы их можно было использовать для отчетов и мониторинга.Данные о кликах будут содержать информацию о том, кто направляет пользователей на этот сайт, откуда приходят пользователи, в какое время они приходят и т. Д. Есть ли способ сохранить и затем проанализировать эти данные, скажем, с 10-минутными интервалами, чтобы вы моглиполучить представление о том, как сайт работает каждые 10 минут.Какой тип базы данных лучше всего подходит для этой цели и какие инструменты анализа могут быстро генерировать значимую информацию из этих данных.Один из вариантов анализа, о котором я думаю, заключается в использовании некоторого варианта map-Reduce для выполнения запросов к этим данным.

1 Ответ

0 голосов
/ 09 апреля 2011

Хотя я еще не пробовал OpenTSDB выглядит многообещающе.

Цитата:

OpenTSDB является распределенным, масштабируемым База данных временных рядов (TSDB) написана на вершина HBase. OpenTSDB был написан для обратиться к общей потребности: магазин, индекс и обслуживать показатели, собранные из компьютерные системы (сетевое оборудование, операционные системы, приложения) на крупномасштабный, и сделать эти данные легко доступный и доступный для восприятия.

...