Как читать регистронезависимую строку имени столбца панды - PullRequest
0 голосов
/ 25 декабря 2018

Как мне прочитать документы Excel, которые имеют одинаковое количество столбцов и должны иметь одинаковые имена столбцов, но в некоторых столбцах может быть прописная буква d, а в других строчная буква d?Я добавляю фреймы данных, которые я должен сначала прочитать, но у меня возникает проблема, когда некоторые столбцы имеют имя «Student_IDs», а другие «Student_Ids»

, например:

df1

  A              Student_IDs
  some text      text
  text           some text

df2

  A              Student_Ids
  text1          some text1
  text2          some text2
  text3          some text3

это код (где dirname - это имя папки, из которой я читаю документы Excel):

for f in glob.glob(dirname + "/*.xlsx"):
    dfMerged = pd.read_excel(f)
    all_data = all_data.append(dfMerged,ignore_index=True)

и у меня тристолбцы вместо двух.

РЕДАКТИРОВАТЬ: мне нужно, чтобы имена столбцов были "A" и "Student_IDs".

1 Ответ

0 голосов
/ 25 декабря 2018

Вы можете решить это, выполнив dfMerged.columns = [x.lower() for x in dfMerged.columns].

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...