У меня есть personID и VaccinationID, нанесенные на оси x и y. Я хочу сгруппировать тех лиц, которые имеют наиболее подобный выбор прививок. Я пытаюсь использовать кластерный алгоритм машинного обучения. Но я не уверен, должен ли я использовать этот алгоритм или совместную фильтрацию пользователей.
Моя цель - добиться индексации по Жакару, то есть найти пересечение или сходство между 10000 людьми и сформировать кластеры и пометить их. Исходя из степени сходства, мне нужно сгруппировать PersonID. Может ли кто-нибудь сказать мне, какой эффективный подход? также, если это возможно сделать с помощью кластеризации для миллионов данных
Я добавил скриншот графика