Используя функцию .tolist (), я создал список 'genrelist'.
genrelist = movies_1000.Genre.str.split().tolist()
print(genrelist)
Вставив полученный вывод: -
[['Action,Crime,Drama'], ['Action,Adventure,Sci-Fi'],
['Action,Biography,Drama'], ['Adventure,Drama,Sci-Fi'],
['Animation,Drama,Fantasy'], ['Biography,Comedy,Drama'],
['Drama,Music'], ['Drama,Mystery,Sci-Fi'], ['Crime,Drama,Thriller'],
['Drama,Family,Music'], ['Action,Thriller'], ['Drama,Thriller'],
['Animation,Adventure,Family'], ['Comedy,Drama'],
['Animation,Drama,Romance']]
Затем я использовал следующеефункция для получения уникальных предметов из этого вложенного списка.
genrecount = Counter()
for arr in genrelist:
genrecount.update(arr[0].split(','))
print(genrecount)
Вставка полученного результата: -
Counter({'Drama': 12, 'Action': 4, 'Adventure': 3, 'Sci-Fi': 3,
'Animation': 3, 'Thriller': 3, 'Crime': 2, 'Biography': 2, 'Comedy':
2, 'Music': 2, 'Family': 2, 'Fantasy': 1, 'Mystery': 1, 'Romance':
1})
Я хотел бы использовать полученный выше вывод для создания новогоDataFrame.Поэтому я использовал следующее: -
genre_df = pd.DataFrame(genrecount.items())
Вставка полученной ошибки: -
ValueError: DataFrame constructor not properly called!
Также пробовал без .items следующим образом: -
genre_df = pd.DataFrame(genrecount.items())
Вставка полученной ошибки: -
ValueError: If using all scalar values, you must pass an index
Итак, я пытаюсь создать новый DataFrame из вывода genrecount, полученного выше.Пожалуйста, посоветуйте, что можно использовать для получения желаемого результата и как правильно маркировать столбцы как Жанр и Количество.Я считаю, что слово Counter в выводе genrecount создает всю суету.Но не знаю, как это исправить.
Также необходимо понять, как изменилась бы логика, если бы мой входной genrelist имел несколько пробелов между строками следующим образом:
[['Action',' Crime',' Drama'], ['Action',' Adventure','Sci-Fi'],
[' Action',' Biography','Drama'], ['Adventure','Drama',' Sci-Fi'],
['Animation','Drama','Fantasy'], ['Biography',' Comedy',' Drama'],
['Drama',' Music '], ['Drama','Mystery',' Sci-Fi'],
['Crime ','Drama',' Thriller'], ['Drama', ' Family ' ,' Music'],
['Action', 'Thriller'], ['Drama',' Thriller'],
['Animation',' Adventure',' Family'], ['Comedy',' Drama'],
['Animation',' Drama',' Romance']]
Спасибозаранее ..!