Question

Пример данных:

test_Unique - это выходной файл, который дает 8,8 2 время, которое мне не нужно, поскольку я хочу только уникальные значения и удаляю дубликаты, но 8,8 появляется 2 время. То же самое для 6,7

dtype для моих данных выборки - это объект 'string', данные выборки находятся в имени столбца final_Unique в моем кадре данных final_task

8,8
6,7
7,7
7,6
2,12
12,3
3,4
4,12
12,12
14,14
1,1
1,12
12,2
2,2
2,4
6,8
8,8

Код Я пытаюсь это:

final_task['test_Unique']=final_task['final_Unique'].drop_duplicates()

но я не получаю идеальный вывод, в чем здесь проблема

RockStar · Answer 1 · 24 февраля 2020

Вы можете перебирать каждую строку, затем разбивать строку, затем находить уникальные и снова присоединяться к ним. Затем вы можете запустить drop_duplicates() на новой серии.

import pandas as pd

df = pd.read_csv("final_task.csv")

df['final_Unique'].apply(lambda x: ",".join(map(str,sorted(map(int,x.split(',')))))).drop_duplicates()

Чтобы найти уникальный из столбца с dtype = object

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Чтобы найти уникальный из столбца с dtype = object

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы