Кто-нибудь знает какие-либо ссылки, документы, презентации или сообщения в блогах, описывающие крупномасштабную систему полнотекстового поиска, построенную на распределенном хранилище ключей / значений?
Меня особенно интересует организация индекса. Что именно представляет собой структура данных? Где и как хранятся словари и публикации? Каков рабочий процесс для обработки запросов? Как запросы обрабатываются таким образом, что нет необходимости перевозить огромные объемы данных по сети?
Я понимаю, что Блекко построен таким образом. Я хотел бы знать, что они или их конкуренты действительно сделали.