Я хочу заниматься без присмотра. Как я понимаю, с таким обучением мы не знаем прежде кластеров, верно? Я читал о k-средних alghoritm, следуя в основном этим двум статьям:
И, возможно, это звучит глупо, нодля меня это какая-то магия, что, следуя примеру с датой, внезапно из ничего «Питон» знает кластеры.
Моя проблема - понять, как это работает изнутри. У меня есть около 100 текстовых документов (резюме), и я хотел бы поиграть с этим алгоритмом - возможно, начать с 2 кластеров - опытный / неопытный, но не хочу просто копировать код из учебных пособий.