Как кластеризовать в следующем наборе данных для IP-адреса источника по записям - PullRequest
0 голосов
/ 24 апреля 2020

Вопрос состоит в том, чтобы кластеризовать IP-адрес источника по количеству записей, в которых они появляются

Как кластеризовать IP-адреса по количеству записей, в которых они появляются? Я попытался запустить это -

 DIP_count  = df['destIP'].value_counts()
 kmeans = KMeans(n_clusters=3)
 kmeans.fit(DIP_count)

Выходные данные выглядят как - Сообщение об ошибке

ValueError: Expected 2D array, got 1D array instead:
array=[1.3505e+04 2.2600e+02 2.2400e+02 2.1500e+02 2.1500e+02 2.1400e+02
 2.1400e+02 2.1200e+02 2.1100e+02 2.1000e+02 2.0900e+02 2.0800e+02
 2.0500e+02 2.0400e+02 2.0400e+02 2.0200e+02 2.0000e+02 1.9900e+02
 1.9500e+02 1.8700e+02 7.4000e+01 6.3000e+01 3.1000e+01 2.4000e+01

С окончательным утверждением -

Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.
...