pandas .duplicated () не может найти дублирующиеся строки - PullRequest
0 голосов
/ 07 мая 2018

У меня есть фрейм данных (df), который я читаю из файла excel, используя код:

xls_file = pd.ExcelFile('/Users/Desktop/df_1.xlsx')
df = xls_file.parse('Sheet1')

Более короткая версия кадра данных транспонирована и показана ниже:

                  0           1           2           3           4

S_Id            SB001       SB001       SB001       SB001       SB001
Reg             27548       27548       27548       27548       27548
Visit           1           2           1           2           3
Planned         5           NaN         5           NaN         NaN
Planned_2       NaN         NaN         NaN         NaN         NaN
Visit_Date      15-07-22    15-10-01    15-07-22    15-10-01    16-08-01
Weight          69          70          69          70          68.3
Height          170         NaN         170         NaN         NaN
Consent         1           NaN         1           NaN         NaN
Filled_Q1       1           1           1           1           1
Filled_Q2       1           1           1           1           1
Other_Id        NaN         NaN         NaN         NaN         NaN
Class1_Taken    1           1           1           1           1
Class1_Date     15-07-22    15-10-01    15-07-22    15-10-01    16-08-01
Class2_Taken    1           1           1           1           1
Class2_Date     15-07-22    15-10-01    15-07-22    15-10-01    16-08-01
Class2_Time     11:05       11:55       11:05       11:55       14:05
Class3_Taken    1           1           1           1           1
Class3_Date     15-07-22    15-10-01    15-07-22    15-10-01    16-08-01
Class3_Time     10:50       10:45       10:50       10:45       13:20
Class4_Taken    1           1           1           1           1
Class5_Taken    1           1           1           1           1
Class6_Taken    1           1           1           1           1
Class7_Taken    1           1           1           1           1
Class8_Taken    0           0           0           0           0

Теперь, если я использую метод .duplicated (), он сгенерирует:

0     False
1     False
2     False
3     False
4     False
dtype: bool

Что не соответствует действительности, поскольку 0, 2 и 1, 3 одинаковы.

Кто-нибудь может здесь помочь? Заранее спасибо!

...