Как искать из многих хранилищ данных GAE? Можно ли использовать Search API? - PullRequest
1 голос
/ 03 апреля 2010

Я хочу создать поисковый интерфейс для поиска данных из хранилища данных GAE? Могу ли я использовать Google Search API для поиска таким образом?

1 Ответ

1 голос
/ 04 апреля 2010

Хранилище данных GAE на самом деле не предлагает многого с точки зрения полнотекстового поиска (такого, который Google Search реализует на веб-страницах) - есть концептуальный пример , но он плохо масштабируется, едва документирован и т. д.

Вы можете попробовать что-то вроде в этом примере (в Java - вы не указываете в своем Q, хотите ли вы использовать Java или Python в своем приложении), или в этом (в Python), но они больше похожи на доказательство концепции (и весьма поучительно, по общему признанию), чем на полностью готовые производимые компоненты. nonrel-search кажется более зрелым, но ограничивает вас Джанго.

Для совершенно другого подхода, использующего преимущества возможностей и API поисковых систем: если вы можете упорядочить все свои данные, чтобы они могли быть представлены в виде «документов» (страниц, сгенерированных при запросе ваших URL), и написать генератор sitemaps , который гарантирует создание всех релевантных URL-адресов, затем вы можете отправить свою карту сайта всем поисковым системам (включая, конечно, Google) - они будут пожинать и индексировать ваши данные, и затем вы можете использовать их API поиска по своему усмотрению (включая, например, ограничение site:whatever.appspot.com в поиске Google; -).

...