Неконтролируемое обучение, Python, кластеризация текста - PullRequest
2 голосов
/ 02 ноября 2019

Я хочу заниматься без присмотра. Как я понимаю, с таким обучением мы не знаем прежде кластеров, верно? Я читал о k-средних alghoritm, следуя в основном этим двум статьям:

И, возможно, это звучит глупо, нодля меня это какая-то магия, что, следуя примеру с датой, внезапно из ничего «Питон» знает кластеры.

Моя проблема - понять, как это работает изнутри. У меня есть около 100 текстовых документов (резюме), и я хотел бы поиграть с этим алгоритмом - возможно, начать с 2 кластеров - опытный / неопытный, но не хочу просто копировать код из учебных пособий.

...