В чем разница между lucene.NET и СУБД? - PullRequest
0 голосов
/ 15 апреля 2011

Я создаю поисковую систему, и я закончил первый этап, который является spidering (выборка HTML-документов и анализ каждого документа, чтобы получить другие ссылки). Теперь я должен проиндексировать содержимое HTML-документов. Прежде всего я решил использовать СУБД (например, SQL Server) для этой цели, но нашел другую библиотеку под названием Lucene.NET.

В чем разница между lucene.NET и SQL Server и какой из них лучше использовать для индексирования HTML-документов? Я много читал о Lucene.Net и удивился, что он дает лучшую производительность, чем SQL Server. Кто-нибудь может мне это объяснить?

1 Ответ

2 голосов
/ 15 апреля 2011

SQL Server - это СУБД общего назначения, которая не оптимизирована для очень быстрой текстовой индексации (да, она имеет полнотекстовые индексы, но одновременно выполняет множество других функций).

Lucene.NET не является СУБД, и его основной функцией является быстрая индексация текста.

Не удивительно, что он лучше, чем SQL Server.

...