Я занимаюсь разработкой поискового компонента веб-приложения с использованием Lucene. Я хотел бы сохранить пользовательские запросы в индексе и использовать их, чтобы предлагать пользователям альтернативные запросы, а также вести статистику запросов (наиболее часто используемые запросы, запросы с наибольшим количеством баллов, ...).
Чтобы использовать эти данные для альтернативных предложений, я бы проанализировал запросы, чтобы увидеть, какие термины чаще всего используются друг с другом, и использовать их для создания предложения для пользователя.
Но я не могу понять, в какой форме индексировать данные. Я думал о простом добавлении запросов в индекс, но в этом случае может быть много избыточных данных, поскольку многие документы в индексе будут иметь одинаковое содержимое. У кого-нибудь есть идеи о том, как это можно сделать?
Спасибо за помощь.