Если у меня есть набор данных, который имеет 2 столбца user_id и их интересы, и я хочу найти пользователей, имеющих общие интересы, как я могу это сделать?Например, я возьму первого пользователя и его интересы и сопоставлю его с общими интересами всех остальных пользователей по отдельности, затем я возьму второго пользователя и сравню его интересы с интересами всех других пользователей и т. Д. ...
Мои данные выглядят так:
userid interest
1 [A, B]
2 [A, C, B]
3 [B, D]
Я не уверен, как это сделать -
for i in range(0,3):
for j in range(i+1, 3):
print((df['interest'].loc[i]).intersection(df['interest'].loc[j]))
Мой вывод должен быть -
userid relativeid common interest
1 2 [A, B]
1 3 [B]
2 3 [B]