Есть ли аналог "стека и карты" с помощью dicts? - PullRequest
0 голосов
/ 25 апреля 2018

Мне недавно пришлось сопоставить ключи в значениях в вопросе оценки. Я начал со следующего:

files=
{'Code.py': 'Stan', 'Output.txt': 'Randy', 'Input.txt': 'Randy'}

И должен был сопоставить файлы их владельцам, для чего я использовал следующее:

mapped={
        name:[key for key,value in files.items() if value==name]
        for name in list(set([value for key,value in files.items()]))
        }

Что дало мне то, что я хотел в mapped дикте:

{'Stan': ['Code.py'], 'Randy': ['Output.txt', 'Input.txt']}

Мне было просто интересно, есть ли более похожий на Панду способ сделать то же самое, но с простым словарем.

1 Ответ

0 голосов
/ 25 апреля 2018

Вы можете просто использовать defaultdict:

from collections import defaultdict
mapped = defaultdict(list)
​
for k, v in files.items():
    mapped[v].append(k)

mapped
# defaultdict(list, {'Stan': ['Code.py'], 'Randy': ['Output.txt', 'Input.txt']})

Или использовать setdefault метод в словаре:

mapped = {}
​
for k, v in files.items():
    mapped.setdefault(v, []).append(k)

mapped
# {'Stan': ['Code.py'], 'Randy': ['Output.txt', 'Input.txt']}

Или, если вы предпочитаете pandas(что, однако, было бы не столь эффективно для этой задачи):

s = pd.Series(files)
s.groupby(s).agg(lambda x: x.index.tolist()).to_dict()
# {'Randy': ['Input.txt', 'Output.txt'], 'Stan': ['Code.py']}

Временная привязка для небольших выборочных данных:

%%timeit
from collections import defaultdict
mapped = defaultdict(list)
​
for k, v in files.items():
    mapped[v].append(k)
# 2 µs ± 33.3 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

%%timeit
s = pd.Series(files)
s.groupby(s).agg(lambda x: x.index.tolist()).to_dict()
# 2.12 ms ± 54.2 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...