У меня есть простой набор данных, который я сохранил в пандах как фрейм данных. Я пытался в каждой строке измерить количество уникальных записей, игнорируя при этом число -1, если оно появляется.
Под добавленным столбцом к фрейму данных
...
Я добавляю этот столбец, выполняя
pdSequences['unique']=pdSequences.apply(pd.Series.nunique, axis=1)
но, как видите, код работает не всегда корректно. Первая строка возвращает правильно, что уникальным является четыре (игнорируя последние два -1).
Если вы видите хотя бы строку 28, я хотел бы вернуть 5, но код возвращает 6.
Можете ли вы помочь мне понять, почему я получаю эти два разных типа поведения и как я могу считать уникальные записи (но игнорируя -1)?
Спасибо
Alex