Я хочу импортировать свои собственные данные (предложения, которые находятся в файле .txt) в этот пример алгоритма, который можно найти по адресу: https://scikit -learn.org / stable / auto_examples / cluster / plot_kmeans_silhouette_analysis.html
Проблема в том, что этот код использует набор данных make_blobs , и мне трудно понять, как заменить его данными из файла .txt.
Все, что я предсказываю, это то, что мне нужно заменить этот кусок кода прямо здесь:
X, y = make_blobs(n_samples=500,
n_features=2,
centers=4,
cluster_std=1,
center_box=(-10.0, 10.0),
shuffle=True,
random_state=1) # For reproducibility
Также я не понимаю этих переменных X, y .Я предполагаю, что X - это массив данных, а что насчет y ?
Должен ли я просто присвоить все X, как это, и этот пример кода будет работать?Но как насчет таких функций make_blobs , как центры, n_features и т. Д.?Нужно ли указывать их как-то иначе?
# open and read from the txt file
path = "C:/Users/user/Desktop/sentences.txt"
file = open(path, 'r')
# assign it to the X
X = file.readlines()
Любая помощь приветствуется!