Получение уникальных значений из одного столбца в кадре данных в Python - PullRequest
1 голос
/ 16 марта 2020

DataFrame

ID                               Source
 0                       52.109.120.107
 1        52.109.120.107, 223.30.22.236
 2                        223.30.22.236
 3        223.30.22.236, 52.109.120.107
 4        52.109.120.107, 223.30.22.236

Ожидаемый вывод # 1

                                 Source
 0        223.30.22.236, 52.109.120.107

Ожидаемый вывод # 2

               Source
0       223.30.22.236
1      52.109.120.107

Код, который я пробовал

list = df['Source'].tolist()
set = set(list)
list2 = list(set)

Любая помощь будет оценена.

Ответы [ 2 ]

1 голос
/ 16 марта 2020

IIU C, мы можем использовать разнесение с некоторыми цепочками методов.

1

s = pd.Series(", ".join(df["Source"].str.split(",").explode().unique()))

print(s)

0    52.109.120.107, 223.30.22.236
dtype: object

2

s1 = pd.DataFrame({'Source' : (df["Source"].str.split(",").explode().unique())})

print(s1)
           Source
0  52.109.120.107
1   223.30.22.236
1 голос
/ 16 марта 2020

пожалуйста, добавьте ваш код на

pd.DataFrame(data = list2,columns = ['Source'])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...