Я использую набор данных MovieLens 20M, но пытаюсь добавить детали сюжета в список фильмов, удаляя IMDB. Я сталкиваюсь с несколькими проблемами (некоторые фильмы имеют несколько графиков, в то время как другие не имеют ни одного), но самая большая проблема сейчас заключается в том, что для моего цикла for с идентификаторами фильмов imdb он заполняет весь фрейм данных любым значением для последнего ввода. ,
Датафрейм выглядит заранее:
movieId | imdbId |tmdbId | title
1 | 114709 | 862.0 |Toy Story (1995)
2 | 113497 |8844.0 |Jumanji (1995)
3 |113228 | 15602.0 |Grumpier Old Men (1995)
А вот мой код для заполнения:
from imdb import IMDb
# create an instance of the IMDb class
ia = IMDb()
for Id in movies.imdbId:
movie = ia.get_movie(Id)
movies['plot1'] = movie['plot']
#try:
#movies['plot2'] = movie['plot'][1]
#movies['synopsis'] = movie.get('synopsis')
#except:
#pass
Тем не менее, это неизбежно дает мне фрейм данных, в котором «plot1» одинаков (я продолжаю получать ошибки на полпути с plot2 и синопсисом, потому что я думаю, что в некоторых фильмах их нет, поэтому попробуйте / исключая. Я работал с этими двумя, чтобы попытаться получить первый сюжет для каждого фильма (по крайней мере, один), но это не так хорошо! И это сюжет для того, что является последним фильмом в списке, так что я буду get 'Джордж Бэнкс должен иметь дело не только с беременной ...' для каждой записи в моем фрейме данных.
когда есть несколько сюжетов, он работает для создания фильма ['plot'] [0] (я первоначально экспериментировал только с кадром данных одной записи, Toy story, и мог получить ['plot'] [0] или [1 ] но я думаю, что это тоже не сработает, как будто есть два сюжета для истории игрушек, чем это может испортить Джуманджи?
Очевидно, я хочу, чтобы сюжет истории игрушек был рядом с историей игрушек, джуманджи - рядом с джуманджи и т. Д. Я не знаю, что происходит :(. Любая помощь приветствуется!