Вопрос состоит в том, чтобы кластеризовать IP-адрес источника по количеству записей, в которых они появляются
Как кластеризовать IP-адреса по количеству записей, в которых они появляются? Я попытался запустить это -
DIP_count = df['destIP'].value_counts()
kmeans = KMeans(n_clusters=3)
kmeans.fit(DIP_count)
Выходные данные выглядят как - Сообщение об ошибке
ValueError: Expected 2D array, got 1D array instead:
array=[1.3505e+04 2.2600e+02 2.2400e+02 2.1500e+02 2.1500e+02 2.1400e+02
2.1400e+02 2.1200e+02 2.1100e+02 2.1000e+02 2.0900e+02 2.0800e+02
2.0500e+02 2.0400e+02 2.0400e+02 2.0200e+02 2.0000e+02 1.9900e+02
1.9500e+02 1.8700e+02 7.4000e+01 6.3000e+01 3.1000e+01 2.4000e+01
С окончательным утверждением -
Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.