Распределенная Lucene.NET - PullRequest
       22

Распределенная Lucene.NET

1 голос
/ 16 апреля 2010

У меня есть терабайт данных, может быть, больше, которые я хотел бы проиндексировать и найти с помощью Lucene. Я хотел бы иметь возможность разделить индекс на разные машины, аналогично тому, что делает Solr (если я правильно понимаю Solr).

Существуют ли какие-либо инструменты для этого на платформе Windows?

Спасибо!

Редактировать : Мне не очень нравится запускать Java Lucene. Скорее всего, я буду делать свои собственные настройки для Lucene, поэтому мне придется придерживаться Lucene.Net, так как я не очень разбираюсь в Java

Ответы [ 3 ]

1 голос
/ 16 апреля 2010

То, что вы ищете, это Катта . Вот график того, как это работает: Катта http://katta.sourceforge.net/wp-content/uploads/kattaoverview.jpg

Но поскольку вы уже знаете Solr, почему бы просто не использовать возможности шардинга напрямую?

0 голосов
/ 16 апреля 2010

Solr - это приложение на Java, поэтому оно работает на Windows. Вы можете найти подробную информацию о том, как настроить его как службу Windows, здесь: http://blog.ianbattersby.com/archive/2010/02/09/apache-solr-as-a-windows-service

0 голосов
/ 16 апреля 2010

Насколько я знаю, нет переноса MultiPassIndexSplitter (http://lucene.apache.org/java/3_0_0/api/contrib-misc/org/apache/lucene/index/MultiPassIndexSplitter.html) класса на Lucene.net, поэтому, вероятно, эта функция еще не реализована.

...