Самый простой или самый простой способ Pythoni c исключить строки в DataFrame на основе списка шаблонов регулярных выражений? - PullRequest
0 голосов
/ 09 июля 2020

Я знаю, что могу исключить строки следующим образом:

df = df[ ~df['B'].str.contains(<regex_pattern>) ]

Но каков самый простой или наиболее * способ c Pythoni для исключения строк из списка шаблонов регулярных выражений? Допустим, что-то вроде следующего:

df = exclude_rows(dataframe, list_of_regex_pats)

(где df будет передаваться как «dataframe».)

Как это можно сделать с помощью DataFrame.drop? Или это проблема, которая требует рекурсивной функции?

1 Ответ

0 голосов
/ 10 июля 2020
def drop_from_patterns(dataframe, column, regex_pattern_list):
    dfcopy = dataframe.copy()
    for pattern in regex_pattern_list:
        dfcopy.drop(dfcopy[ dfcopy[column].str.contains(pattern, case=False) ].index, inplace=True)
    return dfcopy
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...