Дизайн базы данных Google Analytics - PullRequest
4 голосов
/ 15 сентября 2009

Мне было интересно узнать о дизайне базы данных Google Analytics, как они обрабатывают огромные значения ежечасно, даже за минуты.

Допустим, у них есть 100 миллионов пользователей, и почти у каждого пользователя есть 300 счетчиков в каждую минуту. Для одного пользователя 300 счетчиков имеют 18000 строк за один час. За один день это 432K строк и почти 3 миллиона строк.

Я думал, что они не используют реляционную базу данных, но не уверен в этом ...

Есть ли какие-либо предложения по этому поводу?

С уважением,

Ответы [ 2 ]

10 голосов
/ 15 сентября 2009

BigTable

И вы правы, они не используют реляционную базу данных.

1 голос
/ 15 сентября 2009

Высокая масштабируемость содержит краткое описание архитектуры Google здесь . Он не обсуждает аналитику напрямую, но показывает, как BigTable вписывается во всю инфраструктуру. Я не уверен, что детали схемы Google доступны - поскольку статья говорит, что «инфраструктура может быть конкурентным преимуществом», - но я предполагаю, что она намного более тесно связана с аппаратной реализацией, чем обычная модель данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...