У меня есть словарь, состоящий из названий продуктов и уникальных электронных писем клиентов, которые приобрели эти элементы, которые выглядят так:
customer_emails = {
'Backpack':['customer1@gmail.com','customer2@gmail.com','customer3@yahoo.com','customer4@msn.com'],
'Baseball Bat':['customer1@gmail.com','customer3@yahoo.com','customer5@gmail.com'],
'Gloves':['customer2@gmail.com','customer3@yahoo.com','customer4@msn.com']}
Я пытаюсь перебрать значения каждого ключа и определить, сколько писемсовпадать в других ключах.Я преобразовал этот словарь в DataFrame и получил ответ, который хотел получить для сравнения с одним столбцом, используя что-то вроде
customers[customers['Baseball Bat'].notna() == True]['Baseball Bat'].isin(customers['Gloves']).sum()
. Я пытаюсь создать DataFrame, который по сути выглядит так, чтобыЯ легко могу использовать его для диаграмм корреляции.
Backpack Baseball Bat Gloves
Backpack 4 2 3
Baseball Bat 2 3 1
Gloves 3 1 3
Я думаю, что способ сделать это - перебрать словарь customer_emails
, но я не уверен, как вы выберете один ключсравнить его значения со всеми остальными и т. д., а затем сохранить его.