У меня есть набор данных, состоящий из электронных писем и того, как они похожи друг на друга и соотнесены с их оценкой.
emlgroup1 emlgroup2 scores
79 1739.eml 1742.eml 100
130 1742.eml 1739.eml 100
153 1743.eml 1744.eml 99
157 1743.eml 1748.eml 82
170 1744.eml 1743.eml 99
175 1744.eml 1748.eml 82
231 1747.eml 1750.eml 85
242 1748.eml 1743.eml 82
243 1748.eml 1744.eml 82
282 1750.eml 1747.eml 85
Что я хочу сейчас сделать, так это автоматически сгруппировать их и поместить в новыйкадр данных с одним столбцом.
group 1: 1739.eml, 1742.eml
group 2: 1743.eml, 1744.eml, 1748
group 3: 1747.eml, 1750.eml
Требуемый вывод:
Col 1
1 1739.eml 1742.eml
2 1743.eml 1744.eml 1748.eml
3 1747.eml 1750.eml
Я застреваю в логической части, где он разбивает данные на другую группу / кластер,Я действительно новичок в публикации в StackOverflow, поэтому я надеюсь, что не совершаю никаких грехов, заранее спасибо!