Я полагаю, что вы имеете в виду ключевое слово usecols
в pd.read_csv
(или какое-нибудь аналогичное чтение панд)? Я уверен, что вы поняли, что pandas не может выполнять поиск по регулярному выражению на фрейме данных до того, как даже прочитает этот фрейм, поэтому я вполне уверен, что поиск по регулярному выражению с ключевым словом usecols
не существует т выполнимо.
Однако, после того, как вы прочитали csv в фрейм данных (назовем его df
для примера), вы можете очень легко отфильтровать интересующие столбцы с помощью регулярных выражений.
например, предположим, что ваш новый кадр данных загружен в df
:
potential_columns = ['num_id', 'id_num']
df_cols = [col for col in df.columns if re.search('|'.join(potential_columns), col)]
Вы можете перечислить все потенциальные столбцы, которые хотите найти, с помощью potential_columns
. Затем с помощью join
создайте один массивный поиск по регулярному выражению. Затем используйте понимание списка, чтобы объединить все допустимые столбцы в df.columns
. Как только это будет сделано, вы можете завершить этот процесс, позвонив по номеру:
df = df[df_cols]
Работа с дублирующимися столбцами, создание умных ключевых слов для поиска оставлено для вас.