Обработка словарей в Python с большим количеством данных - PullRequest
0 голосов
/ 28 мая 2018

Я сейчас пытаюсь обработать данные IMDb с помощью словаря Python.После некоторой базовой очистки данных у меня есть словарь people_dict, который выглядит как

people_dict = {...,936: ['And White Was the Night (2015)', 'Lipton Cockton in the Shadows of Sodoma (1995)', 'Maraton (1997)', 'Rundi (1990)', 'Sounds Like Suomi (2008)'],...}

, где ключ обозначает идентификатор актера / актрисы, а список представляет собой набор фильмов, которые он / она имеет

Теперь я пытаюсь получить другой словарь movie_dict на основе people_dict, который выглядит как

movie_dict = {...,'Beats, Rhymes & Life: The Travels of a Tribe Called Quest (2011)': [3],...}

, где ключ - это название фильма, а значение - актер./ актриса id.Тем не менее, моя реализация (см. Ниже) для этого - вложенные циклы, но задействовано почти 100 000 фильмов и актеров / актрис.Это оптимистично могло дать то, что я хочу через неделю.

for value in movie_dict.keys():
    for people_id, movie_list in people_dict.items():
        if value in movie_list:
            movie_dict[value].append(people_id)

Так что я могу сделать что-нибудь, чтобы значительно сократить время выполнения.Я проверил эту тему , где карта, кажется, хороший вариант.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...