Я сейчас пытаюсь обработать данные IMDb с помощью словаря Python.После некоторой базовой очистки данных у меня есть словарь people_dict
, который выглядит как
people_dict = {...,936: ['And White Was the Night (2015)', 'Lipton Cockton in the Shadows of Sodoma (1995)', 'Maraton (1997)', 'Rundi (1990)', 'Sounds Like Suomi (2008)'],...}
, где ключ обозначает идентификатор актера / актрисы, а список представляет собой набор фильмов, которые он / она имеет
Теперь я пытаюсь получить другой словарь movie_dict
на основе people_dict
, который выглядит как
movie_dict = {...,'Beats, Rhymes & Life: The Travels of a Tribe Called Quest (2011)': [3],...}
, где ключ - это название фильма, а значение - актер./ актриса id.Тем не менее, моя реализация (см. Ниже) для этого - вложенные циклы, но задействовано почти 100 000 фильмов и актеров / актрис.Это оптимистично могло дать то, что я хочу через неделю.
for value in movie_dict.keys():
for people_id, movie_list in people_dict.items():
if value in movie_list:
movie_dict[value].append(people_id)
Так что я могу сделать что-нибудь, чтобы значительно сократить время выполнения.Я проверил эту тему , где карта, кажется, хороший вариант.