+-----------+-------+-----------------------+
|V1 | n | ip |
+-----------+-------+-----------------------+
|02-08-2017 |2 |00.121.187.120:3447 |
|03-08-2017 |5 |01.110.186.182:23 |
|30-07-2017 |13 |08.167.141.192:25 |
|26-07-2017 |19 |1.175.4.214:33274 |
|01-08-2017 |72 |10.174.218.134:59259 |
+-----------+-------+-----------------------+
Это мой CSV-файл, я пытаюсь использовать метод кластеризации, но мой столбец "V1" сохраняется как строка, поэтому я не могу его прочитать.
import pandas
import pylab as pl
from sklearn.cluster import KMeans
from sklearn.decomposition import PCA
import ast
variables = pandas.read_csv('D:\\Date\\date-dfki.csv',dtype=str)
Y = variables[['V1']]
X = variables[['n']]
Nc = range(1, 20)
kmeans = [KMeans(n_clusters=i) for i in Nc]
kmeans
score = [kmeans[i].fit(Y).score(Y) for i in range(len(kmeans))]
счет
pl.plot(Nc,score)
pl.xlabel('Number of Clusters')
pl.ylabel('Score')
pl.title('Elbow Curve')
Пожалуйста, может кто-нибудь сказать мне, как это сделать, потому что я не могу скрыть строку в плавающем / int, я также не могу продолжить.
Это ошибка, которую я получаю:
array = np.array(array, dtype=dtype, order=order, copy=copy)
**ValueError: could not convert string to float: '27-07-2017'**