С чего начать изучение Lucene.NET Solr Hadoop и MapReduce? - PullRequest
2 голосов
/ 15 августа 2010

Я - разработчик .NET, и мне нужно изучить Lucene, чтобы мы могли запустить очень масштабную службу поиска, которая удаляет записи, к которым у конечного пользователя нет доступа. (т. е. пользователь может искать все документы с уровнем допуска 3 или выше, но не с уровнем разрешения 2 или 1)

С чего начать обучение, какие продукты мне следует рассмотреть? Честно говоря, я немного ошеломлен, но я полон решимости все выяснить ... в конце концов.

Ответы [ 2 ]

1 голос
/ 15 августа 2010

Вы, похоже, не понимаете, что именно делает каждый проект (Lucene / Solr / Hadoop / и т. Д.).Поэтому первое, что нужно сделать, это понять цель каждого проекта.Читайте документы и блоги о них.Если возможно, покупайте и читайте книги о них.

Например, MapReduce и Hadoop не имеют ничего общего с вашими требованиями безопасности.Hadoop - это платформа для распределенных, масштабируемых вычислений.Но Solr масштабируется самостоятельно .Возможно, вы захотите использовать Hadoop, чтобы распространять гусеничный ход (например, Nutch) .

1 голос
/ 15 августа 2010

Если вы хотите книгу, которая охватывает все основы Lucene, рассмотрите « Lucene in Action ».Несмотря на то, что примеры кода являются Java, вы можете легко перенести их на .NET.Конечно, в Интернете также есть тонны ресурсов, таких как SO и списки рассылки Lucene, которые должны помочь вам в этом.

Для проекта, который вы описываете, вы должны взглянуть на Solr, поскольку он абстрагирует множествовопросы масштабируемости и т. д. и через Solrnet могут легко интегрироваться в ваше приложение .NET.Чтобы ограничить доступ по уровню, ваши индексные документы должны содержать поле, скажем, «Уровень», а в фоновом режиме вашего пользовательского запроса вы добавляете запрос «Уровень: Уровень-1», используя логическую конструкцию запроса.

На этом этапе я рекомендую держаться подальше от Hadoop (реализация Apache Map-Reduce) для вашего проекта и придерживаться Solr.Если вы хотите узнать об этом.У него тоже есть очень полезная книга, как вы уже догадались, « Hadoop In Action » (также из публикации Мэннинга).

...