У меня возникла небольшая проблема с добавлением нового столбца в мой Pandas DataFrame: у меня есть DataFrame, в котором каждая строка представляет запись данных о местоположении и отметку времени.Эти записи относятся к поездкам, поэтому каждая строка также содержит идентификатор поездки.Представьте, что DataFrame выглядит примерно так:
TripID Lat Lon time
0 42 53.55 9.99 74
1 42 53.58 9.99 78
3 42 53.60 9.98 79
6 12 52.01 10.04 64
7 12 52.34 10.05 69
Теперь я хотел бы удалить записи всех поездок, в которых содержится меньше минимального количества записей.Я подумал, что мог бы просто получить количество записей каждой поездки следующим образом:
lengths = df['TripID'].value_counts()
Тогда моя идея состояла в том, чтобы добавить дополнительный столбец в DataFrame и заполнить его значениями из этой Серии, соответствующей поездке.идентификатор каждой записи.Тогда я смог бы избавиться от всех строк, в которых значение столбца length
слишком мало.
Однако я не могу найти способ получить значения длины в правильныестрок.Будет ли у кого-нибудь идея для этого или даже лучший подход ко всей проблеме?
Большое спасибо!
РЕДАКТИРОВАТЬ:
Мой желаемыйвывод должен выглядеть примерно так:
TripID Lat Lon time length
0 42 53.55 9.99 74 3
1 42 53.58 9.99 78 3
3 42 53.60 9.98 79 3
6 12 52.01 10.04 64 2
7 12 52.34 10.05 69 2