Цикл For вводит данные только с последнего элемента в списке при попытке заполнить фрейм данных информацией о графике imdb. - PullRequest
0 голосов
/ 24 мая 2019

Я использую набор данных MovieLens 20M, но пытаюсь добавить детали сюжета в список фильмов, удаляя IMDB. Я сталкиваюсь с несколькими проблемами (некоторые фильмы имеют несколько графиков, в то время как другие не имеют ни одного), но самая большая проблема сейчас заключается в том, что для моего цикла for с идентификаторами фильмов imdb он заполняет весь фрейм данных любым значением для последнего ввода. ,

Датафрейм выглядит заранее:

movieId | imdbId |tmdbId | title   
1       | 114709 | 862.0 |Toy Story (1995)  
2       | 113497 |8844.0 |Jumanji (1995)  
3       |113228  | 15602.0 |Grumpier Old Men (1995)  

А вот мой код для заполнения:

from imdb import IMDb

# create an instance of the IMDb class
ia = IMDb()

for Id in movies.imdbId:
    movie = ia.get_movie(Id)
    movies['plot1'] = movie['plot']
    #try:
        #movies['plot2'] = movie['plot'][1]
        #movies['synopsis'] = movie.get('synopsis')
    #except: 
        #pass

Тем не менее, это неизбежно дает мне фрейм данных, в котором «plot1» одинаков (я продолжаю получать ошибки на полпути с plot2 и синопсисом, потому что я думаю, что в некоторых фильмах их нет, поэтому попробуйте / исключая. Я работал с этими двумя, чтобы попытаться получить первый сюжет для каждого фильма (по крайней мере, один), но это не так хорошо! И это сюжет для того, что является последним фильмом в списке, так что я буду get 'Джордж Бэнкс должен иметь дело не только с беременной ...' для каждой записи в моем фрейме данных.

когда есть несколько сюжетов, он работает для создания фильма ['plot'] [0] (я первоначально экспериментировал только с кадром данных одной записи, Toy story, и мог получить ['plot'] [0] или [1 ] но я думаю, что это тоже не сработает, как будто есть два сюжета для истории игрушек, чем это может испортить Джуманджи?

Очевидно, я хочу, чтобы сюжет истории игрушек был рядом с историей игрушек, джуманджи - рядом с джуманджи и т. Д. Я не знаю, что происходит :(. Любая помощь приветствуется!

...