Могу ли я передать регулярное выражение в pandas index_col - PullRequest
1 голос
/ 05 августа 2020

У меня есть множество файлов данных для загрузки, где имена столбцов несовместимы.

В идеале я бы перешел к pd.read_csv(file, index_col = 'patient_id')

Но в данных я нахожу имена столбцов для id вроде 'patien_id','pat_id' et c.

Итак, я подумал, что передача какого-то регулярного выражения было бы неплохо. Есть идеи?

Лучшее

1 Ответ

2 голосов
/ 05 августа 2020

Вы можете попробовать отфильтровать столбцы в вашем Pandas кадре данных с помощью регулярного выражения:

df = pd.read_csv(file)              # read entire CSV into dataframe
df = df.filter(regex=("pat.*_id"))  # subset dataframe to only the columms you want
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...