Question

В моем pandas фрейме данных у меня есть столбец, где каждая строка столбца представляет собой список с повторяющимися значениями. Например - фрейм данных с 3 строками: df = pd.DataFrame({'Column_1': [[1,2,3,2],[1,1,2],[1,2,3]]}) Я хочу удалить дубликаты. Мой ожидаемый результат - что-то вроде [[1,2,3],[1,2],[1,2,3]]. Как я могу применить заданную функцию для удаления дубликатов в каждом из списков?

Заранее спасибо!

ipj · Answer 1 · 03 августа 2020

Учитывая df:

import pandas as pd
import numpy as np
df = pd.DataFrame({'Column_1': [[1,2,3,2],[1,1,2],[1,2,3]]})

Попробуйте:

df.Column_1 = df.Column_1.apply(lambda r : list(set(r)))

или:

df.Column_1 = df.Column_1.apply(np.unique)

результат:

    Column_1
0  [1, 2, 3]
1     [1, 2]
2  [1, 2, 3]

Как применить функцию набора ко всем строкам указанного столбца c, элементы которого являются списком с повторяющимися значениями?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как применить функцию набора ко всем строкам указанного столбца c, элементы которого являются списком с повторяющимися значениями?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов