Я работаю с набором данных в блокнотах Jupyter, где я хочу фильтровать по местоположению и году, чтобы суммировать статистику на основе идентификаторов образцов.
Данные хранятся в формате CSV, shape is (35743, 62)
.
Таким образом, из большего набора данных я хочу создать df, который имеет сводную статистику для всех образцов сайтов в местоположении x в Year = y.
Мой фильтр местоположения работает отлично, когда работает на данныхустановите фильтры, как ожидалось, и годовой фильтр также работал нормально. Все отлично подходит для большинства комбинаций местоположения и года, производящих DF в соответствии с моими потребностями.
Тем не менее, я обнаружил, что при переходе в конкретное местоположение (1 из 20) и фильтре на 2018 год фильтр возвращает только результаты дляодин образец ID. Другие годы работают нормально.
Год - это число с плавающей точкой (я рассматриваю его как число, а не дата), как и вся остальная информация, кроме столбца даты выборки, который является объектом.
Есть идеи, почему этот вопрос настолько специфичен?
Я подумал, что это может быть мой фильтр
df= data.loc[data['Year'] == 2018]
Но у меня те же проблемы с использованием виджета Qgrid.
Спасибо за любую помощь.