Я столкнулся с реальной проблемой. Мне нужно сделать несколько кластеров Kmeans для 5 миллионов векторов, каждый из которых содержит около 32 столбцов.
Я опробовал Mahout, который требует Linux, и я на Windows, я ограничен от использования ОС Linux и любого вида симулятора.
Кто-нибудь может предложить алгоритм кластеризации KMeans, который масштабируется до 5М векторов и может быстро сходиться?
Я протестировал несколько, но они не масштабируются. Это означает, что они медленные и требуют вечности.
Спасибо