Подумайте, если использование lucene / solr действительно полезно для вас.Я не хочу, чтобы меня неправильно поняли, но если вам нравится искать внутри столбца user_id конкретный идентификатор пользователя, вам не нужен дополнительный механизм полнотекстового поиска.
В любом случае - может быть, вам нравится только иметьмаленький проект, чтобы "играть с" Solr.Итак, вот ответы на ваши вопросы:
Каким образом я должен привести все в solr, что касается индексации?
Поместить все в solr / luceneнужно искать.Используйте DHI (обработчик импорта данных) http://wiki.apache.org/solr/DataImportHandler, чтобы позволить solr пройти через вашу таблицу и проиндексировать данные.
Придется ли мне индексировать теги, представления, дату?
Да.Вы должны проиндексировать все вещи, с которыми вам нравится работать.Кстати: есть разница между индексированием и хранением данных.Вы можете индексировать поля (например, теги, user_id, views, ..), но вам не нужно хранить их (дополнительно) внутри индекса lucene.Хранение данных необходимо, если lucene / solr должны вернуть / доставить найденные данные.В противном случае solr возвращает только uniqueKey (первичный ключ) документов совпадений, и вам нужно извлечь данные из datebes (... где pk = <результат lucene>). Таким образом, вам не нужно хранить те поля, которыерелевантно только для сортировки (например).
Что я должен индексировать, чтобы у меня была максимальная производительность?
Индексировать только те поля (столбцы), с которыми вам нужно работатьс (solr).Не индексируйте поле, которое вы никогда не будете запрашивать / искать.