Как применить функцию набора ко всем строкам указанного столбца c, элементы которого являются списком с повторяющимися значениями? - PullRequest
0 голосов
/ 03 августа 2020

В моем pandas фрейме данных у меня есть столбец, где каждая строка столбца представляет собой список с повторяющимися значениями. Например - фрейм данных с 3 строками: df = pd.DataFrame({'Column_1': [[1,2,3,2],[1,1,2],[1,2,3]]}) Я хочу удалить дубликаты. Мой ожидаемый результат - что-то вроде [[1,2,3],[1,2],[1,2,3]]. Как я могу применить заданную функцию для удаления дубликатов в каждом из списков?

Заранее спасибо!

1 Ответ

0 голосов
/ 03 августа 2020

Учитывая df:

import pandas as pd
import numpy as np
df = pd.DataFrame({'Column_1': [[1,2,3,2],[1,1,2],[1,2,3]]})

Попробуйте:

df.Column_1 = df.Column_1.apply(lambda r : list(set(r))) 

или:

df.Column_1 = df.Column_1.apply(np.unique)

результат:

    Column_1
0  [1, 2, 3]
1     [1, 2]
2  [1, 2, 3]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...