Я пишу программу для выборки 3 ближайших соседей для каждой точки данных в моем наборе данных. В моем наборе данных 47 объектов с 5000 записями строк и без целевой переменной. Я использую этот здесь , чтобы поместить весь мой набор данных в массив numpy. Я разрабатываю следующий код, но, похоже, застрял:
X = df.to_numpy()
from sklearn.neighbors import NearestNeighbors
def findsuccess(id):
nbrs = NearestNeighbors(n_neighbors=3)
nbrs.fit(X)
pred = nbrs.kneighbors(X,3)
for i in pred:
print "What should come here" ?? - I need to print my 3 neighbours here at this step
Публикуйте это сообщение. Я хочу использовать функцию findsuccess
, чтобы передать идентификатор, для которого я ищу соседей, и распечатать этот список в Excel как хорошо. Например:
затем вызов функции: # findsuccess(1234)
Конечная цель - увидеть 3 ближайших соседей из моего id
1234 из моего набора данных. Конечная цель состоит в том, чтобы напечатать этих трех соседей в выходном файле как это:
id Neigh1 Neigh2 Neigh3
1234 1334 1444 1555