Как извлечь неструктурированные данные файла Excel (данные панели мониторинга) и экспортировать их в виде структурированных чистых данных - PullRequest
0 голосов
/ 12 февраля 2020

У меня есть много файлов Excel, в которых данные представлены в виде панели инструментов, и я хочу, чтобы эти данные читались в python структурированным образом, как каждый столбец данных в файле Excel представляет столбец данных в столбце pandas .

enter image description here

import pandas as pd
df=pd.read_excel('claim.xls',index=None,error_bad_lines=False)
df

когда я запускаю этот код, я получаю следующий вывод: enter image description here

Есть ли в python какой-либо другой подход для получения всех данных в коде?

1 Ответ

0 голосов
/ 12 февраля 2020

Вам необходимо:

  1. указать буквы столбцов, которые вы хотите извлечь.
  2. установить количество строк, которые нужно пропустить
  3. переименовать столбцы
import pandas as pd

df = pd.read_excel('claim.xls', skiprows=range(1, 11), usecols = "C,E,G,J,N,R,V,Z,AD,AH,AL,AP,AT")
df.columns = ['Enc. ID', 'Post Date', 'Claim ID', 'Svc. Date', 'Procedure', 'Mod', 'Patient', 'Billed to', 'Adj.Charge', 'Payments', 'Value', 'A/R Balance', 'Age']

Вывод:

   Enc. ID           Post Date  Claim ID           Svc. Date Procedure  Mod            Patient          Billed to Adj.Charge Payments   Value A/R Balance   Age
0  41083.0 2019-12-12 12:00:00  167189.0 2019-12-11 12:00:00     99204  NaN    Smith, Susan L.  NOVITAS SOLUTIONS     280.00        -  280.00      280.00  15.0
1  41156.0 2019-12-16 12:00:00  167774.0 2019-12-13 12:00:00     99204   25   Hester, Joyce A.  NOVITAS SOLUTIONS     280.00        -  280.00      280.00  13.0
2  41187.0 2019-12-18 12:00:00  169213.0 2019-12-17 12:00:00     99396  NaN  RHODA, KATHLEEN M      TRICARE PRIME     270.00        -  270.00      270.00   9.0
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...