Проверка кластеризации на основе плотности (DBCV) никогда не прекращается - PullRequest
1 голос
/ 08 июля 2019

Я завершил работу DBSCAN на наборе данных моих кластерных участков обезлесения и пытаюсь проверить результаты в соответствии с этой статьей.

Я установил пакет из этой Github, но когда я пытаюсь запустить код, он никогда не завершается.Я запускал его более 5 дней, и он никогда не прекращал работать и не выдавал ошибку.Запуск DBSCAN занял всего 15 минут, поэтому я немного запутался, почему проверка занимает так много времени.Есть ли что-то, что я ошибаюсь с кодом DBCV или входами?

Так как он никогда не завершает выполнение кода, я не знаю об ошибке, о которой я могу сообщить.Я не уверен, правильно ли вводю данные в код, но я попытался скопировать пример на GitHub как можно точнее.Я не знаю, как поделиться своим файлом .csv, чтобы показать, на что похож мой файл.Он имеет 16 измерений, которые я согласен использовать MinMaxScaler перед запуском DBSCAN.Я ранее закончил кластеризацию DBSCAN и просто пытался заставить работать DBCV.

import pandas as pd
import numpy as np
from pylab import rcParams
import matplotlib.pyplot as plot
import sklearn
from sklearn.cluster import DBSCAN
from sklearn.preprocessing import MinMaxScaler
from scipy.spatial import euclidean
from DBCV import DBCV

f = pd.read_csv('csv_file_I_Don't_know_how_to_share')
x = f.loc[:, [1-15]].values

norm_data = MinMaxScaler()
data = norm_data.fit_transform(x)

dbscan = DBSCAN(eps=.15, min_samples = 100)
clusters = dbscan.fit_predict(data)

DBCV_score = DBCV(data, clusters, dist_function=euclidean)

print ('DBCV Score: ' + DBCV_score)

Я ожидаю, что счет будет напечатан, но вместо этого код продолжает работать и не останавливается.Любая помощь будет отличной!

...