Большинство компаний веб-аналитики используют какую-то распределенную файловую систему для хранения журналов, например HDFS, QFS ... Причина в том, что данные слишком велики для традиционной базы данных.
Аналитические отчеты создаются с помощью задания MapReduce.
Если вы хотите выполнить специальный запрос, вы обычно используете что-то вроде Hive / Pig / Sawzall.