Какой алгоритм я должен использовать, чтобы соответствовать шаблону или найти пересечение между наборами данных? - PullRequest
0 голосов
/ 09 октября 2019

У меня есть personID и VaccinationID, нанесенные на оси x и y. Я хочу сгруппировать тех лиц, которые имеют наиболее подобный выбор прививок. Я пытаюсь использовать кластерный алгоритм машинного обучения. Но я не уверен, должен ли я использовать этот алгоритм или совместную фильтрацию пользователей.

Моя цель - добиться индексации по Жакару, то есть найти пересечение или сходство между 10000 людьми и сформировать кластеры и пометить их. Исходя из степени сходства, мне нужно сгруппировать PersonID. Может ли кто-нибудь сказать мне, какой эффективный подход? также, если это возможно сделать с помощью кластеризации для миллионов данных

Я добавил скриншот графика

...