Полнотекстовый поиск с сервисами Amazon - PullRequest
0 голосов
/ 16 января 2012

Я бы переместил свое приложение в Amazon SimpleDb, так как я не собираюсь самостоятельно обслуживать базу данных.Это приложение живет под большой нагрузкой.Есть много операций чтения / записи в секунду.Мне не нужна последовательность и атомарность, и я хочу, чтобы все было как можно проще, поэтому SimpleDb - хороший выбор.

Проблема в том, что мне нужны возможности полнотекстового поиска.И я не знаю, как сделать это лучше с Amazon SimpleDb.Я реализовал ранее рукописный полнотекстовый поиск с базой данных mongoDb.Мне пришлось разделить текст на слова на уровне приложения и создать собственный индекс.Это было не сложно, но я не хочу делать это снова с SimpleDb

Я нашел интересную статью http://codingthriller.blogspot.com/2008/04/simpledb-full-text-search-or-how-to.html

Но я бы не хотел реализовывать это сам.Я ищу готовое решение

Какие есть варианты?

Что лучше для пользователя Amazon RDS + Lucene?

Или, возможно, существуют готовые решения для SimpleDb?

Требования:

  • возможность обрабатывать множество запросов параллелизма
  • полнотекстовый поиск (размер текста не должен превышать 1 МБ (ограничение SimpleDb))
  • предпочтительно не администрировать его самостоятельно.

Ответы [ 3 ]

4 голосов
/ 17 января 2012

Люцен или подобное - обычно способ, которым люди делают это, но не зная, с какой платформой вы работаете, сложно что-то предложить конкретно. Simol - это инфраструктура сохранения объектов .NET для SimpleDb, которая может использовать Lucene.NET для индексации. Я также рассмотрел некоторые базовые примеры Lucene.NET, которые не так уж плохи. Если вы ищете размещенную службу индексирования, вы можете взглянуть на этот вопрос.

Чтобы ваша индексация работала хорошо, вам, скорее всего, придется адаптировать ее к вашему приложению.

3 голосов
/ 18 января 2012

Похоже, Amazon объявит о поиске 18 января 2012 года. http://pandodaily.com/2012/01/17/good-news-for-ec2-customers-amazon-may-launch-new-cloud-search-tomorrow/

SimpleDB для полнотекстового поиска не велика. Он не будет искать более чем около 300 000 документов в одном поле, например, с помощью оператора% like%. Это займет около двух или трех попыток - около 15 секунд, чтобы пройти только сто МБ текста в поисках совпадения. Я думаю, что это слишком медленно, как и другие. Смотрите форумы AWS ...

1 голос
/ 03 мая 2012

Amazon CloudSearch был выпущен, но у него нет простого способа перенести данные из SimpleDB в CloudSearch без написания кода.

API, однако, довольно прост и, вероятно, может начать работатьчерез неделю или две в зависимости от ваших потребностей (если вы используете существующие SDK).Если вы используете язык программирования без SDK, это займет у вас больше времени.

http://aws.amazon.com/cloudsearch/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...