Роб предложил хороший подход с использованием MapReduce.
Я полагаю, что этот вид обработки является частью процесса интеллектуального анализа данных, и в процессе интеллектуального анализа данных используется иной подход, чем в традиционной модели ответа на запрос.
Какминимальный
создайте одну таблицу (денормализованную) и сохраните всю необходимую информацию в этой таблице, а затем, когда пользователям потребуется информация в режиме реального времени, просто выполните поиск в таблице и получите информацию как можно быстрее.
, но у этого подхода есть проблемы, и одна из основных проблем заключается в заполнении данных в этой ненормализованной таблице.
Большую часть времени это может быть сделано в автономном режиме, например, при ночной работе или при заполнении этой таблицы, когда нагрузка минимальна!
Этот подход является одним из подходов, используемых вВы видите «Клиент, который купил этот товар, также купил» в типичном приложении электронной коммерции.
для получения дополнительной информации и справок, см.
1- Анализ сервера SqlУслуги
2 - Совместная фильтрация элементов к элементам (особенно относится к реализации Amazon )