Допустим, у меня есть фрейм данных, который выглядит следующим образом.
df1:
ID Skill Community
1 IT X
1 Analytics X
1 ERP X
2 Analytics X
2 ERP X
2 CRM X
2 Finance X
И еще один фрейм данных, похожий на этот:
df2:
ID Skill
3 Public Speaking
3 IT
3 Management
3 ERP
4 HR
4 Finance
...
Моя цель состоит в том, чтобы в основном сказать, что , если конкретный человек (идентифицированный по его идентификатору) имеет как минимум 2 общих навыка с кем-то из df1 , то он также должен быть назначен сообществу X.
В приведенном выше примере идентификатор nº3 также должен быть присвоен сообществу X (поскольку он обладает навыками ИТ и ERP, точно так же как ID nº1 ), но не идентификатор nº4, поскольку он имеет только соответствующий навык с идентификатором nº2 (с финансами).
Мой ожидаемый результат должен выглядеть следующим образом для df2 :
ID Skill Community
3 Public Speaking X
3 IT X
3 Management X
3 ERP X
4 HR NULL
4 Finance NULL
.....
На данный момент я использую только команду% in% с df2 [df2 & Skill% in% df1 $ Skill,] , но это только проверка для одного определенного навыка , и не обрабатывает это по ID.
Есть ли у вас какие-либо идеи о том, как мне подойти к этой проблеме?
Любая помощь будет принята с благодарностью.