У меня есть фрейм данных со столбцом с именем Actors
, где каждая ячейка содержит строку, подобную этой "Abigail Breslin, Greg Kinnear, Paul Dano, Alan Arkin"
. Я бы sh разделил эту строку на (",")
, чтобы в ячейке содержался список каждого актера, т.е. ["Abigail Breslin", "Greg Kinnear, "Paul Dano, "Alan Arkin"]
, чтобы я мог создать фиктивные переменные для каждого уникального актера. Я еще нашел решение, которое фактически разделяет строку и отправляет соответствующее имя актера в новый столбец.
Любая помощь будет принята с благодарностью :)
Мой Dataframe (df) выглядит так это
Title (Object)| Actors (Object) | Year (Object)
Pulp Fiction | Bruce Willis, Amanda Plummer, Laura Lovelace, John Travolta | 1994
Fight Club | Edward Norton, Brad Pitt, Helena Bonham Carter, Meat Loaf | 1999
Моя цель состоит в том, чтобы мой фрейм данных выглядел следующим образом
Title (Object)| Bruce Willis | Amanda Plummer | Laura Lovelace | John Travolta | Edward Norton | Year
Pulp Fiction | 1 | 1 | 1 | 1 | 0 | 1994
Fight Club | 0 | 0 | 0 | 0 | 1 | 1999
Я пытался
import pandas as pd
data = 'Imdb_datajson(Cleaned).csv'
df = pd.read_csv(data)
list_of_unique_actors = df.Actors.unique().tolist()
list_of_unique_actors
newlist = []
for actor in list_of_unique_actors:
actor = actor.split(",")
newlist.extend(actor)
И получил эту ошибку
AttributeError Traceback (most recent call last)
<ipython-input-48-ae50a804fe05> in <module>
5 newlist = []
6 for word in list_of_unique_actors:
----> 7 word = word.split(",")
8 newlist.extend(word)
9 return newlist
AttributeError: 'float' object has no attribute 'split'