Я использую Lucene .NEt для полнотекстового поиска. До сих пор я индексировал PDF-документы, но теперь у меня есть несколько веб-страниц, которые мне нужно проиндексировать. Какой лучший / самый простой способ индексировать документы HTML, чтобы добавить в мой индекс Lucene? Я использую .NET / C #