Как часто вы обновляли свои индексы?Какого рода запросы к данным вы выполняете?
Возможно, вы можете выполнять обычную сортировку данных в конце каждого дня, чтобы ускорить другие запросы?(создайте новые таблицы с этой сопоставленной информацией)
Как таблица посещений страницы может иметь запись для каждого дня о том, сколько раз была достигнута эта страница - таким образом, вам не нужно выполнять полное сканирование таблицыпри каждом запросе вы просто нажимаете на таблицу посещений.
В уникальной таблице хостов могут быть записи о времени ожидания, сколько страниц они просмотрели, количество загруженных файлов, общая пропускная способность, отказ от сеанса, уникальные файлы cookie (разные пользователи, возможно, за прокси-серверами или межсетевыми экранами).
Какой график очистки вы планируете, если таковой имеется?
Хотя приятно хранить все эти данные навсегда, особенно для вещей, о которых вы еще не думали, подавляющее большинство того, что вам нужно, - это сопоставленные данные - так что создавайте свои отчеты вокруг этого и сохраняйтенеобработанные данные для этих случаев вам действительно нужно что-то уникальное.
Это все, что вам нужно построить с хранилищем значений ключей (например, simpledb или bigtable).