Очистка данных со списком в Excel - PullRequest
0 голосов
/ 02 мая 2020

У меня есть список в Excel. Один код в столбце A, а другой в столбце B.

Есть веб-сайт, на котором мне нужно ввести обе детали в двух разных полях, и он переходит на другую страницу.

Эта страница содержит некоторые детали, которые мне нужно просмотреть в Excel.

Любая помощь в этом?

1 Ответ

0 голосов
/ 04 мая 2020

Хорошо. Дайте этому шанс:

import pandas as pd
import requests



df = pd.read_excel('C:/test/data.xlsx')



url = 'http://rla.dgft.gov.in:8100/dgft/IecPrint'
results = pd.DataFrame()
for row in df.itertuples():
    payload = {
            'iec': '%010d' %row[1],
            'name':row[2]}
    response = requests.post(url, params=payload)
    print ('IEC: %010d\tName: %s' %(row[1],row[2]))
    try:
        dfs = pd.read_html(response.text)
    except:
        print ('The name Given By you does not match with the data OR you have entered less than three letters')
        temp_df = pd.DataFrame([['%010d' %row[1],row[2], 'ERROR']],
                               columns = ['IEC','Party Name and Address','ERROR'])
        results = results.append(temp_df, sort=False).reset_index(drop=True)
        continue

    generalData = dfs[0]
    generalData = generalData.iloc[:,[0,-1]].set_index(generalData.columns[0]).T.reset_index(drop=True)

    directorData = dfs[1]
    directorData = directorData.iloc[:,[-1]].T.reset_index(drop=True)
    directorData.columns = [ 'director_%02d' %(each+1) for each in directorData.columns ]

    try:
        branchData = dfs[2]
        branchData = branchData.iloc[:,[-1]].T.reset_index(drop=True)
        branchData.columns = [ 'branch_%02d' %(each+1) for each in branchData.columns ]
    except:
        branchData = pd.DataFrame()
        print ('No Branch Data.')

    temp_df = pd.concat([generalData, directorData, branchData], axis=1)
    results = results.append(temp_df, sort=False).reset_index(drop=True)


results.to_excel('path.new_file.xlsx', index=False)

Вывод:

print (results.to_string())
          IEC IEC Allotment Date            File Number   File Date                             Party Name and Address      Phone No                     e_mail            Exporter Type IEC Status Date of Establishment BIN (PAN+Extension) PAN ISSUE DATE PAN ISSUED BY  Nature Of Concern                                      Banker Detail                                        director_01                                        director_02                                        director_03                                          branch_01                                          branch_02                                          branch_03                                          branch_04                                          branch_05                                          branch_06                                          branch_07                                          branch_08                                          branch_09
0  0305008111         03.05.2005  04/04/131/51473/AM20/  20.08.2019  NISSAN MOTOR INDIA PVT. LTD. PLOT-1A,SIPCOT IN...  918939917907  shailesh.kumar@rnaipl.com  5 Merchant/Manufacturer  Valid IEC            2005-02-07    AACCN0695D FT001            NaN           NaN  3 Private Limited  STANDARD CHARTERED BANK A/C Type:1 CA A/C No :...  HARDEEP SINGH BRAR GURMEL SINGH BRAR HOUSE NO ...  JEROME YVES MARIE SAIGOT THIERRY SAIGOT A9/2, ...  KOJI KAWAKITA KIHACHI KAWAKITA 3-21-3, NAGATAK...  Branch Code:165TH FLOOR ORCHID BUSINESS PARK,S...  Branch Code:14NRPDC , WAREHOUSE NO.B -2A,PATAU...  Branch Code:12EQUINOX BUSINESS PARK TOWER 3 4T...  Branch Code:8GRAND PALLADIUM,5TH FLR.,B WING,,...  Branch Code:6TVS LOGISTICS SERVICES LTD.SING,C...  Branch Code:2PLOT 1A SIPCOT INDUL PARK,ORAGADA...  Branch Code:5BLDG.NO.3 PART,124A,VALLAM A,SRIP...  Branch Code:15SURVEY NO. 678 679 680 681 682 6...  Branch Code:10INDOSPACE SKCL INDL.PARK,BULD.NO...
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...