Я использую кластеризацию DBSCAN для текстового документа следующим образом, благодаря этому сообщению .
db = DBSCAN(eps=0.3, min_samples=2).fit(X)
core_samples_mask1 = np.zeros_like(db1.labels_, dtype=bool)
core_samples_mask1[db1.core_sample_indices_] = True
labels1 = db1.labels_
Теперь я хочу увидеть, какой документ принадлежит какому кластеру, например:
[I have a car and it is blue] belongs to cluster0
или
idx [112] belongs to cluster0
Похожий способ, которым мой вопрос задан в здесь , но я уже проверил некоторые ответы, представленные там как:
X[labels == 1,:]
и я получил:
array([[0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0],
[0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0]], dtype=int64)
но это мне не помогает.Пожалуйста, дайте мне знать, если у вас есть предложения или способы сделать это.