Попытка использовать первые 23 строки фрейма данных Pandas в качестве заголовков, а затем развернуть заголовки - PullRequest
0 голосов
/ 13 марта 2020

Я вытягиваю фрейм данных, используя tabula. К сожалению, данные расположены в строках, как показано ниже. Мне нужно взять первые 23 строки и использовать их в качестве заголовков столбцов для оставшихся данных. Мне нужно, чтобы каждая строка содержала эти 23 заголовка для каждой из примерно 60 клиник.

                                         Col  \
0                                       Date   
1                                     Clinic   
2                                   Location   
3                             Clinic Manager   
4                                 Lease Cost   
5                             Square Footage   
6                           Lease Expiration   
8                              Care Provided   
9                 # of Providers (Full Time)   
10                    # FTE's Providing Care   
11                   # Providers (Part-Time)   
12                    Patients seen per week   
13  Number of patients in rooms per provider   
14        Number of patients in waiting room   
15                              # Exam Rooms   
16                           Procedure rooms   
17                               Other rooms   
18                             Specify other   
20                               Other data:   
21                                 TI Needs:   
23              Conclusion  & Recommendation   
24                                      Date   
25                                    Clinic   
26                                  Location   
27                            Clinic Manager   
28                                Lease Cost   
29                            Square Footage   
30                          Lease Expiration   
32                             Care Provided   
33                # of Providers (Full Time)   
34                    # FTE's Providing Care   
35                   # Providers (Part-Time)   
36                    Patients seen per week   
37  Number of patients in rooms per provider   
38        Number of patients in waiting room   
39                              # Exam Rooms   
40                           Procedure rooms   
41                               Other rooms   
42                             Specify other   
44                               Other data:   
45                                 TI Needs:   
47              Conclusion  & Recommendation   

                                                  Val  
0                                           9/13/2017  
1                                 Gray Medical Center  
2                 1234 E. 164th Ave Thornton CA 12345  
3                                            Jane Doe  
4                      $23,074.80 Rent, $5,392.88 CAM  
5                                               9,840  
6                                           7/31/2023  
8                                     Family Medicine  
9                                                  12  
10                                                 14  
11                                                  1  
12                                                750  
13                                                  4  
14                                                  2  
15                                                 31  
16                                                  1  
17                     X-Ray, Phlebotomist/blood draw  
18                                                NaN  
20  Facilities assistance needed.  50% of business...  
21  Paint and Carpet (flooring is in good conditio...  
23  Lay out and occupancy flow are good for this p...  
24                                          9/13/2017  
25                                    Main Cardiology  
26               12000 Wall St Suite 13 Main CA 12345  
27                                           John Doe  
28                       $9610.42 Rent, $2,937.33 CAM  
29                                              4,406  
30                                          5/31/2024  
32                                         Cardiology  
33                                                  2  
34                                       11, 2 - P.T.  
35                                                  2  
36                                                188  
37                                                  0  
38                                                  2  
39                                                  6  
40                                                  0  
41  1 - Pacemaker, 1 - Treadmill, 1- Echo, 1 - Ech...  
42  Nurse Office, MA station, Reading Room, 2 Phys...  
44  Occupied in Emerus building. Needs facilities ...  
45                    New build out, great condition.  
47  Practice recently relocated from 84th and Alco...  

Я смог улучшить свой фрейм данных, исправив заголовки. Я пересылаю первые 3 «группы» данных, чтобы лучше проиллюстрировать структуру фрейма данных. Все повторяется (заголовки и значения) для каждого клини c.

1 Ответ

1 голос
/ 14 марта 2020

Попробуйте:

df2 = pd.DataFrame(df[23:].values.reshape(-1, 23),
                   columns=df[:23][0])
print(df2)

В идеале число 23 - это число столбцов в каждой строке для результата df. Вы можете заменить его желаемым количеством столбцов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...