У меня есть словарь словарей со следующей структурой:
1:{'Amendment': '1',
'status': 'Stadf\xc3\xa6stet',
'Name': 'Bodil Kornbek',
'title': 'L 1 Forslag til till\xc3\xa6gsbevillingslov for 2004.',
'fremsat': '2005-03-04',
'Vote.Numeric': '2',
'PSession': '1',
'vedtaget': '2005-04-12',
'Lsession': '3',
'Voteid': '38',
'Month': '4',
'Year': '2005',
'Vote': 'Frav\xc3\xa6rende',
'Party': 'KD',
'Law': 'L 1',
'ministerie': 'Finansministeriet'}
диапазон ключей от 1 до ок. 500000, и каждый вложенный словарь содержит информацию об одном члене датского парламента за один голос. Кроме того, есть информация, которая идентифицирует уникальный голос, за который проголосовал участник. Я хотел бы, чтобы каждый участник извлек все голоса, в которых этот участник был активен, и сравнивал бы поведение участников, участвующих в голосовании, со всеми остальными участниками, которые были активны в том же подгруппе голосов, итеративно.
В идеале для каждого участника я бы сравнил этого члена с одним другим участником по голосам, в которых они были активны, и вычислил долю голосов, в которых они проголосовали, одинаково для всех их общих голосов. Если доля больше, чем, скажем, 0,65, то пара добавляется в список.
Таким образом, конечными результатами должен быть список в формате:
[member1, member2
member1, member4
member1, member7
member2, member5
etc..
]
Может кто-нибудь показать мне, как это можно сделать в python?