loc не работает должным образом в ноутбуке Jupyter - PullRequest
0 голосов
/ 07 ноября 2019

Я работаю с набором данных в блокнотах Jupyter, где я хочу фильтровать по местоположению и году, чтобы суммировать статистику на основе идентификаторов образцов.

Данные хранятся в формате CSV, shape is (35743, 62).

Таким образом, из большего набора данных я хочу создать df, который имеет сводную статистику для всех образцов сайтов в местоположении x в Year = y.

Мой фильтр местоположения работает отлично, когда работает на данныхустановите фильтры, как ожидалось, и годовой фильтр также работал нормально. Все отлично подходит для большинства комбинаций местоположения и года, производящих DF в соответствии с моими потребностями.

Тем не менее, я обнаружил, что при переходе в конкретное местоположение (1 из 20) и фильтре на 2018 год фильтр возвращает только результаты дляодин образец ID. Другие годы работают нормально.

Год - это число с плавающей точкой (я рассматриваю его как число, а не дата), как и вся остальная информация, кроме столбца даты выборки, который является объектом.

Есть идеи, почему этот вопрос настолько специфичен?

Я подумал, что это может быть мой фильтр

df= data.loc[data['Year'] == 2018]

Но у меня те же проблемы с использованием виджета Qgrid.

Спасибо за любую помощь.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...