По какой-то причине, когда я печатаю в Excel, я получаю только 1 из 2000 наблюдений, столбец «pay_id» не в порядке, и появляется загадочный (безымянный) столбец. Я пробовал это несколькими различными способами, но не могу понять, что вызывает это. Основная часть кода была закончена кем-то другим и передана мне, чтобы отформатировать и распечатать его, чтобы преуспеть. Я стажируюсь, и мой наставник проводит меня в первые несколько недель, когда я пытаюсь понять рабочий процесс, начав стажировку из дома.
Есть идеи?
`
import xlsxwriter as xw
import pandas as pd
from datetime import datetime, date
pyms = pd.read_csv('payments_results.csv', sep=',')
print(pyms.dtypes)
pf = pyms
print(pf.columns)
pf['pym_rls_dt'] = pd.to_datetime(pf['pym_rls_dt'].yearfirst=True)
pf['bgn_pym_dt'] = pd.to_datetime(pf['bgn_pym_dt'].yearfirst=True)
pf['end_pym_dt'] = pd.to_datetime(pf['end_pym_dt'].yearfirst=True)
pf = pf.sort_values(by=['clm_number', 'bgn_pym_dt']).reset_index(drop=True)
pf['delta'] = (pf['bgn_pym_dt'] - pf.groupby('clm_num')['end_pym_dt'].shift(1)).dt.days
hits = pf.loc[pf['delta']>30].reset_index(drop=True)
print(hits.loc[hits['pay_id']==42803]). #<---- could this be why I only get one row?
writer = pd.ExcelWriter('Payments_nicole.xlsx',
engine ='xlsxwriter',
date_format ='mm/dd/yyyy)
pym.to_excel(writer, sheet_name ='Payment Gap > 30+ Days')
workbook = writer.book
worksheet = writer.sheets['Payment Gap > 30+ Days', startcol=2]
#format1 = workbook.add_format({'num_format': '#,##0'})
worksheet.set_column('A:A', 4)
worksheet.set_column('B:B', 8)
worksheet.set_column('C:C', 8)
worksheet.set_column('D:D', 2)
worksheet.set_column('E:E', 5)
worksheet.set_column('F:F', 5)
worksheet.set_column('G:G', 7)
worksheet.set_column('H:H', 3)
worksheet.set_column('I:I', 8)
worksheet.set_column('J:J', 8)
worksheet.set_column('K:K', 8)
worksheet.set_column('L:L', 8)
writer.save()`