Я совершенно новый в Python.
Я пытаюсь использовать пакет nltk.cluster для применения простого kMeans к матрице текстового документа. Хотя это работает, когда матрица представляет собой список объектов, похожих на массивы, я не смог заставить ее работать для разреженного представления матрицы (например, csc_matrix, csr_matrix или lil_matrix).
Вся информация, которую я нашел, была:
Обратите внимание, что векторы должны использовать массивные объекты, похожие на массивы. nltk_contrib.unimelb.tacohn.SparseArrays может использоваться для эффективности при необходимости
Я не понимаю, что это значит. Кто-нибудь может мне помочь в этом вопросе?
Заранее спасибо!