Я создаю поисковую систему, и я закончил первый этап, который является spidering (выборка HTML-документов и анализ каждого документа, чтобы получить другие ссылки). Теперь я должен проиндексировать содержимое HTML-документов. Прежде всего я решил использовать СУБД (например, SQL Server) для этой цели, но нашел другую библиотеку под названием Lucene.NET.
В чем разница между lucene.NET и SQL Server и какой из них лучше использовать для индексирования HTML-документов? Я много читал о Lucene.Net и удивился, что он дает лучшую производительность, чем SQL Server. Кто-нибудь может мне это объяснить?