Алгоритм расчета аналогичных магазинов на основе еженедельных данных - PullRequest
0 голосов
/ 23 сентября 2019

У меня есть данные уровня транзакций для различных магазинов, которые агрегируются на еженедельном уровне.Для каждого магазина существуют различные переменные, такие как продажи, количество клиентов и т. Д. Теперь я хочу сгруппировать похожие магазины на основе еженедельных значений для этих переменных.Таким образом, набор данных будет выглядеть примерно так:

Store . Sales . Cust_count . Week
X .     100 .   30 .         1
X .     200 .   40 .         2
Y .     80 .    30 .         1
Y .     70 .    15 .         2

Теперь я сомневаюсь, что если я напрямую использую алгоритм кластеризации, такой как k-means, на этом наборе данных, то он будет кластеризовать аналогичные точки данных, которые могут принадлежатьтот же магазин вместо кластеризации аналогичных магазинов.Итак, как мне придумать методологию или алгоритм, который сравнивает недельное недельное сходство между различными магазинами, а затем создает окончательный индекс сходства между магазинами или кластерными подобными магазинами.

...