Кеширование HTML-страниц - PullRequest
0 голосов
/ 25 ноября 2011

Я хотел механизм для кэширования / индексации HTML-страниц для веб-сайта, как он есть.Таким образом, если запросы снова поступают на эту страницу, я могу просто извлечь эту страницу из кэша или индекса и отправить ее.Это возможно с Solr?Потому что Solr всегда хранит отображаемую (текстовую) часть html, а не весь HTML Dom.Есть ли какая-либо другая технология с открытым исходным кодом, которая может помочь мне сделать это с высокой производительностью?

1 Ответ

1 голос
/ 25 ноября 2011

В этом вопросе много недостающих деталей, но ответ на ваш вопрос о Solr, в частности, да, Solr может отлично хранить исходный HTML.Обычно вы используете поле с сохраненным = "истинным", чтобы иметь возможность извлекать исходный HTML, и индексированное = "истинное" вместе с HTML-фильтром , чтобы сохранять только текстовый поиск.

...