Поисковая система для веб-приложений - многоязычная и многоязычная - PullRequest
0 голосов
/ 01 октября 2010

Я работаю над проектом сайта.У нас есть база MySql и MongoDb.

  • Мы хотим добавить полнотекстовый поисковый движок по этим базам (и если он может быть связан с PostgreSql, то лучше).

  • Эти базы данных содержат многоязычные тексты, но мы не можем определить язык.

Я видел Solr, ElasticSearch и Sphinx, но что вы посоветуете по этой теме?

  • У Solr и Sphinx есть стемминги, но я не уверен, что мы можем использовать их без знания языка контента ...

  • Elastic заполненJSON, что может быть лучше, если мы будем использовать все больше и больше mongoDb ...

Ответы [ 2 ]

0 голосов
/ 01 октября 2010

Существует продукт от Basis Technologies под названием Rosette Language Platform, который выполняет автоопределение языков, на которые вы можете посмотреть.

Solr поддерживает JSON для результатов (и индексации ???), если это ключевой механизм интеграции. Я бы поставил поддержку «JSON» чуть ниже в списке вещей, по которым нужно составить оценочную карту, и сосредоточился бы на том, насколько релевантными будут результаты от поисковой системы X для моего домена.

0 голосов
/ 01 октября 2010

Неважно, какую поисковую систему вы используете, stemming сильно зависит от языка.ИМХО, вам придется как-то определить язык, чтобы передать текст нужному стеммеру.

...