Создать поисковик для сайта в asp .net c # - PullRequest
1 голос
/ 04 мая 2011

оповещение новичка!

ASP .net | C # | VS2008 | MS SQL server 2008 R2 Express

У меня есть база данных с именами файлов, путями к файлам и категориями файлов. У меня также есть много статических страниц на сайте. Я хочу разработать собственную поисковую систему (поскольку мне не разрешено использовать другие сторонние инструменты - в основном они хотят, чтобы я заново изобрел колесо).

Когда пользователь что-то ищет, он должен искать имена файлов, а также содержимое статических страниц. Имена файлов можно искать прямо из базы данных (сделал это). Статические страницы оптимизированы для SEO с заголовками и т. Д.

Как мне проиндексировать статические страницы на сайте? Как создать поисковый индекс после добавления нескольких страниц в будущем? Есть ли такие функции, как curl в php, которые можно использовать в ASP.net C #?

Также я слышал о полнотекстовом поиске. Любые ссылки о том, как запросить полнотекстовую базу данных?

П.С.: Новичок:)

Ответы [ 2 ]

1 голос
/ 04 мая 2011

Если вы уверены, что ваши страницы вообще не изменятся в ближайшем будущем, посмотрите полнотекстовую индексацию SQL, которая должна служить большинству целей.Но если вам нужно расширяться в будущем. Вам следует взглянуть на Apache Solr (созданный с использованием Lucene) - он предлагает интерфейс RESTful для интеграции в .NET или любую другую платформу, которую вы предпочитаете.Он предлагает все вкусности, которые могут потребоваться, такие как огранка, не заботясь о совместимости Java, версий .NET и т. Д.

Вы можете легко интегрировать Solr в свое приложение .NET, используя 1

0 голосов
/ 04 мая 2011

Вам не нужно использовать cURL для pHP. Просто используйте функции ввода-вывода для управления списком файлов в каталоге (в Интернете), получения их содержимого и сохранения их в базе данных для последующего поиска. Из текста вы можете извлечь заголовок страницы, метатеги тоже с регулярными выражениями.

Дайте мне знать, если вам нужен код для этого, если логика подходит вам.

...