Алгоритм сопоставления слов - PullRequest
0 голосов
/ 28 декабря 2010

Мы разрабатываем мобильное приложение, которое считывает штрих-коды продуктов и получает цены с 8 сайтов электронной коммерции.Я проектирую сторону веб-сервера на C #, которая имеет всю логику и отправляет данные клиенту через веб-сервис.

Если я спрашиваю цену продукта, отправив штрих-код, все в порядке.Но большинство систем веб-сайтов не имеют номеров штрих-кодов в своей базе данных, поэтому я должен отправить им название продукта, и оно ДОЛЖНО совпадать, чтобы получить информацию о продукте.

Чтобы получить название продукта, я делаюUPC поиск и получить название продукта с веб-сайта.

Но проблема начинается в этот момент.Каждый сайт электронной коммерции может иметь различную структуру и другое название продукта.Как я собираюсь написать алгоритм, который будет анализировать базы данных электронной коммерции и приносить мне результаты.Нужно ли мне писать отдельный анализатор данных для каждого сайта электронной коммерции.Есть ли алгоритм, который я могу написать.

Любая помощь будет оценена.

Ответы [ 3 ]

1 голос
/ 28 декабря 2010

Боюсь, вам придется написать этот парсер. Я сомневаюсь, что есть какой-то алгоритм, который вы могли бы использовать, кроме того, как этот алгоритм должен работать ... (вероятно, как ваш парсер)

0 голосов
/ 07 января 2011

Я обнаружил, что, если я отправлю каждое слово в названии продукта в массиве строк, веб-сайт электронной коммерции сможет искать в своей базе данных слово за словом, пока не получит один результат продукта, и вернет его мне.

0 голосов
/ 28 декабря 2010

1-One решение будет хранить общее имя продукта в таблице базы данных, чтобы вы могли сохранить их в памяти сервера в виде статического списка и обновить список с помощью задания на EOD.

2- Найти некоторыевнешний веб-сервис, который предоставляет имя prodcutname и использует этот сервис в вашем веб-сервисе.

, потому что вы просто не можете перейти на каждый веб-сайт для анализа данных.

...