Сопоставление на основе произвольных категорий и мер подобия - PullRequest
0 голосов
/ 06 апреля 2011

У меня есть база данных клиентов с определенными атрибутами и тип клиента.Коллекция атрибутов может варьироваться (хотя они и приходят из конечного набора), и когда я смотрю на нового клиента с неизвестным типом, с заданными атрибутами, я бы хотел определить, к какому типу он / она принадлежит.Например, скажем, у меня есть эти клиенты уже в БД,

Customer | Type | Attributes

1           A      44,32,5,'X'
2           A      3,32,66,'A'
3           B      6,32,'A', 'B'           
4           C      47,31,2,'H'           
5           C      14,32,2,'O'  
6           C      2,'C'  
7           A      44

Когда я получу нового клиента с атрибутами, например, 3,32,2, я бы хотел определить, к какому типу принадлежит этот клиенти код должен сообщать о своей достоверности (в процентах) этого совпадения.

Какой метод лучше использовать здесь?Что-то статистическое, или метод, основанный на некоторой матрице сродства, или метод рекомендаций, основанный на коэффициентах корреляции Пирсона?Пример, псевдокод будет приветствоваться, но любой, все идеи в порядке.

Спасибо,

1 Ответ

0 голосов
/ 06 апреля 2011

Способ решения этой проблемы - использование Наивного Байеса.

...