Как найти правильную категорию для каждого продукта? - PullRequest
0 голосов
/ 22 февраля 2010

Мне нужно представить свои сотни продуктов на сотни веб-сайтов. Для большинства сайтов мне нужно выбрать каталог / категорию для каждого продукта. Но, похоже, у каждого сайта есть свое определение категорий. Например, некоторые перечисляют ноутбуки под компьютерами / оборудованием, некоторые под компьютерами / ноутбуками, некоторые под / электроникой / компьютерами, некоторые под электроникой / ПК.

Так сложно автоматически выбрать категорию для каждого продукта. Не могли бы вы дать мне несколько советов?

Большое спасибо!

Ответы [ 2 ]

2 голосов
/ 22 февраля 2010

Да, это сложно. Никто не согласен с категориями.

Команда Unix «rm» («удалить») пишется «del» в Windows. Зачем? Люди не согласны с тем, что так просто и очевидно.

Какую магию ты хочешь? Ваша задача требует человек до думаю .

Человек должен (1) понять ваши продукты и (2) понять категории веб-сайтов, а затем (3) выбрать правильную категорию на основе понимания. Думай и выноси суждение.

Поскольку категории веб-сайтов - это просто слова, вашему программному обеспечению может потребоваться угадать и предположить некоторые значения. Что означает «домашнее хозяйство» или «потребитель»? Только в контексте можно догадаться о значении.

0 голосов
/ 22 февраля 2010

Я бы попытался построить граф с синонимами и обобщениями. Например, Notebook и Laptop являются синонимами. Computer обобщает их. PC является синонимом Computer. Electronics снова обобщает Computer (и его синоним PC).

Теперь, для данного продукта, посмотрите на самый глубокий уровень доступных категорий и найдите наиболее конкретные синонимы для этого продукта на вашем графике. Если совпадений нет, переместитесь на один уровень вверх, потому что они могут иметь более конкретные категории, чем вы представляете на графике - например, они могут делить ноутбуки по брендам. Когда вы дойдете до корня категорий без совпадения, перейдите к первому обобщению с вашего графика и снова выполните поиск с самого глубокого уровня категории вверх.

У этого решения все еще есть проблемы, потому что, например, категории могут быть разделены по брендам на очень высоком или очень глубоком уровне, и вы выбираете один вариант при построении графика. С такими случаями тоже вполне можно справиться, но это станет намного сложнее.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...