tslearn.clustering.TimeSeriesKMeans против sklearn.cluster.KMans - PullRequest
1 голос
/ 30 апреля 2019

Если я не использую DTW в качестве метрики расстояния, то и tslearn.clustering.TimeSeriesKMeans, и sklearn.cluster.KMeans эквивалентны друг другу?

Если нет, может кто-нибудь сказать мне, в чем главное отличие этих двух пакетов?

1 Ответ

4 голосов
/ 06 июня 2019

Основным отличием является только то, что в качестве метрики в tslearn Kmeans можно использовать «dtw», что полезно при кластеризации данных временных рядов разной длины, тогда как в sklearn это дает ошибку, если ваши данные временного ряда, если разной длины, в основном потому, что эторассматривайте каждую временную отметку как новую функцию, а когда ваши данные не в матричном формате, они считают ее неправильным форматом.

Интересно знать, что сам tslearn использует sklearn в фоновом режиме.

Но все жеМожет возникнуть проблема с tslearn при кластеризации данных различных «n_clusters», отличных от 2, например, скажем 3. / Иногда он предсказывает только 2 метки. здесь я упомянул сделать 4 кластера, но он дал только 2 метки

...