Существует ли библиотека веб-поиска с открытым исходным кодом, которая не использует файл индекса поиска? - PullRequest
0 голосов
/ 07 ноября 2008

Я ищу библиотеку веб-поиска с открытым исходным кодом, которая не использует файл индекса поиска. Вы знаете кого-нибудь?

Спасибо, Кеннет

Ответы [ 3 ]

1 голос
/ 07 ноября 2008

Вы имеете в виду:

search.cgi

#/bin/sh
arg=`echo $QUERY | sed -e 's/^s=//' -e 's/&.*$//'`
cd /var/www/httpd
find . -type f | xargs egrep -l "$arg" | awk 'BEGIN { 
        print "Content-type: text/html"; 
        print "";
        print "<HTML><HEAD><TITLE>Search Result</TITLE></HEAD>";
        print "<BODY><P>Here are your search results, sorry it took so long.</P>";
        print "<UL>";
    }
    { print  "<LI><A HREF=\"http://yourhost.com/" $1 "\">" $1 "</A></LI>"; }
    END {
        print "</UL></BODY>";
    }'

Непроверено ...

1 голос
/ 07 ноября 2008

Оригинальный постер пояснил в комментарии к этому ответу, что он ищет, по сути, «grep-подобный поиск, но через HTTP», и упомянул, что он ищет что-то, что использует маленький диск, когда он работает со встроенной системой.

Я не знаю ни о каких связанных проектах, но вы можете посмотреть html-парсеры и реализации xquery на вашем языке. Вы должны быть в состоянии позаботиться о «реальной» неразберихе html с первым и написать поиск, который почти настолько подробен, насколько вы могли бы пожелать с последним.

Я предполагаю, что вы будете работать с набором URL-адресов, которые будут либо предоставлены, либо уже сохранены локально, поскольку идея реального обхода всей сети, обнаружения ссылок и т. Д. Во встроенном устройстве совершенно нереальна.

Хотя с хорошей реализацией html / xquery у вас есть инструменты для извлечения всех ссылок ..

Мой оригинальный ответ, который действительно был просьбой о разъяснении :

Не уверен, что вы имеете в виду. Как вы представляете поиск, работающий без индекса? Сканирование в Интернете по каждому запросу? Трубить через гугл? Или вы имеете в виду файл индекса поиска определенного типа, который вы пытаетесь избежать?

0 голосов
/ 26 марта 2009

Я думаю, что нет (по крайней мере, это достаточно популярно для пользователей здесь, чтобы быть в курсе).

Мы начали кодировать нашу собственную поисковую систему.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...