Представьте, у меня есть два источника данных.Один источник вызывает Mærsk для AP Møller - Mærsk A , а другой - AP Møller - Mærsk A / S .Сейчас у меня много компаний, и я хочу упростить их именование.
Оба источника проиндексированы вasticsearch, но я слишком новичок в этой технологии, чтобы придумать правильный поисковый запрос.Сначала я использовал common
, который дает приличные результаты, но я полагаю, что есть лучшие способы.
Есть предложения?
РЕДАКТИРОВАТЬ
Небольшое уточнение.Мои два источника - это просто источник данных, которые предоставляют названия компаний.Я сохранил эти имена в своем собственном индексе для каждого источника - документ - это просто имя.
Итак, у меня есть два индекса с названиями компаний (больше ничего).Теперь для каждого названия компании в индексе A
я хочу найти соответствующую компанию в индексе B
.Сложность заключается в том, что существуют разные способы написания названия компании - оно не стандартизировано.Я хочу создать эту ссылку с минимальным ручным трудом и минимальным риском для ошибок.