Удалить несколько строк с одинаковыми значениями индекса в кадре данных Python - PullRequest
0 голосов
/ 29 мая 2019

У меня есть набор данных с количеством IDS начальной станции, IDS конечной станции и продолжительностью поездки для велосипедов в городе.Данные датируются 2017 годом и, следовательно, в настоящее время некоторые станции не существуют.У меня есть список этих идентификаторов станций.Как удалить строки из кадра данных, который начинается или заканчивается на этих станциях?

Например, если я хочу удалить StartStation ID = 135, который находится в индексах 4 и 5, что мне делать?Это означает миллион строк, где 135 может присутствовать где угодно.

Bike   Id      StartStation Id  EndStation Id   Duration    
0      395     573              137.0           660.0   
1      12931   399              507.0           420.0   
2      7120    399              507.0           420.0
3      1198    599              616.0           300.0   
4      10739   135              486.0           1260.0  
5      10949   135              486.0           1260.0  
6      8831    193              411.0           540.0   
7      8778    266              770.0           600.0   
8      700     137              294.0           540.0   
9      5017    456              39.0            3000.0  
10     4359    444              445.0           240.0   
11     2801    288              288.0           5340.0  
12     9525    265              592.0           300.0   

1 Ответ

0 голосов
/ 29 мая 2019

Я вызываю ваш список идентификаторов, чтобы удалить remove_ids.

df=df.loc[
    (~df['StartStation ID'].isin(removed_ids)) &\
    (~df['EndStation ID'].isin(removed_ids))
]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...