Я работаю с CSV-файлом в формате, подобном приведенному ниже, созданным с помощью df.groupby для фильтрации идентификаторов, где публикуются общие ссылки.
url id
bbc.com ['183','194','101']
cnn.com ['182', '193', '103']
google.com ['131']
Я сейчас пытаюсь включить это в новый CSV, который показывает каждый раз, когда два идентификатора разделяют одну и ту же ссылку.
Так что мой идеальный вывод будет выглядеть так, особенно без кавычек:
source target
183, 194
183, 101
194, 101
182, 193
182, 103
103, 193
Буду очень признателен за любую помощь!
Я пытался начать с df.drop, чтобы удалить строки, содержащие менее одной записи, но он читает всю запись как строку, то есть ['183,' 194 ',' 101 '] в целом Строка, а не список, поэтому я немного застрял.