Вопрос дизайна: поиск товаров или автоматическая маркировка товаров? (поиск против машинного обучения) - PullRequest
4 голосов
/ 20 июня 2011

Я работаю над проектом, в котором многие ритейлеры загружают информацию о своих продуктах независимо друг от друга, иными словами, один и тот же продукт может иметь различное название. Например, новый ipad или ipad или отличный ipad и т.д ...

Я хочу представить пользователю интуитивно понятный интерфейс, чтобы при поиске ipad или ipads он получал в результате поиска один ipad со всеми сопоставленными ценами. Или, может быть, 2 результата поиска, первый со старым ipad со всеми ценами от разных продавцов, и другой результат поиска с ipad 2, а также с ценами один рядом с другим.

Конкретный пример: база содержит: новый ipad 1, ipad 1, отличный ipad 1, новый ipad 2, ipad 2, отличный ipad 2 когда пользователь ищет ipad, он получает:

  • ipad1: цена продавца 1 = 100 $, цена продавца 2 = 120 $ и т. Д ...
  • ipad2: цена ритейлера 2 = 100 $, цена ритейлера 2 = 120 $ и т. Д. ...

Это в основном проблема, связанная с поиском? ИЛИ машинное обучение, автоматическая маркировка?

А кто-нибудь знает что-нибудь такое, что было реализовано в Rails3?

Спасибо

1 Ответ

1 голос
/ 20 июня 2011

Это проблема удаления дубликата. Карты, каталоги занимаются этим. Есть много решений этой проблемы с различной степенью успеха. Самый простой способ - определить синонимы и бесполезные слова (отлично, весело) и т. Д. И сопоставить элементы, используя эту информацию. Некий неясный случай, который вы должны отправить человеку на рассмотрение.

Пример "новый Apple Ipad" против "Великого ipad" = удалить бесполезное слово => "Apple ipad" против "ipad" = равно подстроке / неоднозначному => равно

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...