найти повторяющиеся строки, содержащие различные типы списков (списков) в кадре данных панд - PullRequest
0 голосов
/ 14 июня 2019

Фон

У меня есть следующее df, которое содержит сочетание типов списков

import pandas as pd
df = pd.DataFrame({'Size' : [[[['small', 'small', 'big', 'big']]], [['big', 'small','small']], ['big'], ['big']], 
                  'ID': [1,2,3,3], 
                  'Animal' : [['cat', 'dog', 'dog', 'cat'], ['dog', 'pig','dog'], ['pig'], ['pig']]

                 })

, которое выглядит следующим образом

    Animal                ID    Size
0   [cat, dog, dog, cat]    1   [[[small, small, big, big]]]
1   [dog, pig, dog]         2   [[big, small, small]]
2   [pig]                   3   [big]
3   [pig]                   3   [big]

Проблема

Я использую следующее

df.duplicated()

Я получаю следующую ошибку, поскольку мой фрейм данных содержит список (по крайней мере, я так думаю)

TypeError: unhashable type: 'list'

Вопрос

Как проверить наличие дублирующихся строк в кадре данных, который содержит несколько типов списков?

1 Ответ

0 голосов
/ 30 июня 2019
df.loc[df.astype(str).drop_duplicates().index]
...