Прочтите файл Excel и пропустите пустые строки - PullRequest
0 голосов
/ 17 июня 2020

У меня есть лист Excel, содержащий данные, как показано ниже, он содержит столбцы данных.

Rahul     e34   Pradeep  e44  Azhar  t54  
Venkat    r45   Akash    e14  Vipul  r15  Fairo   e45 
Akshay    e44   
Pavan     e24   Asad     t14

Когда я запускаю приведенный ниже код

import pandas as pd
import numpy as np 
df = pd.read_excel (r'C:\\Users\\Kiran\\Desktop\\Data\\Output1.xlsx')
df=pd.DataFrame(np.reshape(df.to_numpy(),(-1,2)))
df.to_excel("Output2.xlsx")

Я получаю вывод как

     0           1
0   Rahul       e34   
1   Pradeep     e44  
2   Azhar       t54  
3       
4   Venkat      r45   
5   Akash       e14  
6   Vipul       r15  
7   Fairo       e45 
8   Akshay      e44    
9       
10      
11      
12  Pavan       e24   
13  Asad        t14
14      
15     

Мне нужен вывод, как показано ниже

Rahul       e34   
Pradeep     e44  
Azhar       t54     
Venkat      r45   
Akash       e14  
Vipul       r15  
Fairo       e45 
Akshay      e44    
Pavan       e24   
Asad        t14

Строка 1 (0,1) и 1-й столбец (0,1,2,3,4 ..... 15) должны не отображаются вместе с тем, как удалить пустые места. Кто-нибудь может помочь мне. Цените вашу помощь.

1 Ответ

0 голосов
/ 17 июня 2020

Вы можете использовать аргумент index & header в df.to_excel(). Также используйте header=None при чтении Excel в pandas DF. Если вы этого не сделаете, в выходном файле будет отсутствовать наблюдение.

Вот рабочий код:

import pandas as pd
import numpy as np 

df = pd.read_excel ('input.xlsx',header=None)
df=pd.DataFrame(np.reshape(df.to_numpy(),(-1,2)))

df.dropna(axis=0,inplace=True)
clean_df=df[:].astype('str').apply(lambda x: x.str.strip())

print(clean_df)

df.to_excel("Output.xlsx",index=False,header=False)
...