Как создать подмножество кадра данных с определенными значениями в столбце? - PullRequest
0 голосов
/ 14 апреля 2019

Я пытаюсь создать подмножество кадра данных на основе нескольких значений, найденных в столбце.Это столбец 'tencode_desc', и я хочу выбрать следующие значения:

"Ограбление / Ограбление", "Ограбление банка", "Резиденция кражи со взломом", "Кража со взломом - нерезиденция", "Кража"

Я попытался создать новую переменную с этими строками, а затем использовать функцию .isin со столбцом

df.columns

Index(['id', 'call_time', 'complaint_id', 'shift', 'tencode', 'tencode_desc','disposition', 'disposition_desc', 'unit', 'sector', 'zone', 'lat','lng'],dtype='object')

Вот что я пробовал:

tencode_filter = ['Holdup / Robbery', 'Bank Robbery', 'Burglary Residence', 'Burglary - Non-Residence', 'Theft']

df.loc[df['call_time'].isin(tencode_filter)]

Я получаю эту ошибку ValueError: ('Unknown string format:', 'Holdup / Robbery')

1 Ответ

1 голос
/ 14 апреля 2019

Используйте

df = df[df.tencode_desc.str.contains('|'.join(tenecode_filter))]

Чтобы объединить ваши параметры в регулярное выражение.Вам может понадобиться экранировать специальные символы, такие как '/', которые вы используете.Такие как

tencode_filter = ['Holdup \/ Robbery', 'Bank Robbery', 'Burglary Residence', 'Burglary - Non-Residence', 'Theft'].
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...