У меня есть фрейм данных, где некоторые ячейки содержат списки нескольких значений. Как я могу создать новые столбцы на основе уникальных значений этих списков? Эти списки могут содержать значения, уже включенные в предыдущие наблюдения, а также могут быть пустыми. Как создать новый столбец (One Hot Encoding) на основе этих значений?
ПРОВЕРИТЬ РЕДАКТИРОВАТЬ - Данные в кавычках:
data = {'tokens': ['["Spain", "Germany", "England", "Japan"]',
'["Spain", "Germany"]',
'["Morocco"]',
'[]',
'["Japan"]',
'[]']}
my_new_pd = pd.DataFrame(data)
0 ["Spain", "Germany", "England", "Japan"]
1 ["Spain", "Germany"]
2 ["Morocco"]
3 []
4 ["Japan", ""]
5 []
Name: tokens, dtype: object
Я хочу что-то вроде
tokens_Spain|tokens_Germany |tokens_England |tokens_Japan|tokens_Morocco
0 1 1 1 1 0
1 1 1 0 0 0
2 0 0 0 0 1
3. 0 0 0 0 0
4. 0 0 1 1 0
5. 0 0 0 0 0