Я делаю ниже, в настоящее время; успешно отбрасываю весь ряд с моим if in
- но, оказывается, мне не нужно отбрасывать весь ряд .. Как я могу обрабатывать ячейки конкретно.
Как я могу сохранить ту же логику, но применить к CELL ... преобразовать ячейки N/A,
NaT
и NaN
в пустые?
for row in excel_data.itertuples():
ids = row.IDS
total_records += 1
if ids in ("", " ", "N/A", "NaT", "NaN", None) or math.isnan(ids):
# print(f"Invalid record: {row}")
num_invalid_records += 1
# total_invalid = num_invalid_records + dup_count
excel_data = excel_data.drop(excel_data.index[row.Index])
# continue
else:
num_valid_records += 1
continue
Мои данные выглядят так: (ниже)
Как вы можете видеть, есть N / As, которые, похоже, переводятся как «NaT» или «Nan» в Пандах - я просто хотел бы преобразовать их в пустые или «» или даже пропустить как-нибудь, если это возможно ....
![enter image description here](https://i.stack.imgur.com/shlpv.png)
В пандах фрейм данных будет выводить вот так (я пропустил некоторые важные записи, но вы поняли идею) .
External_Referral='qweryt', Transitions_Planning='NF', Date_ICP_ICT_Signed_by_Member__Caregiver=datetime.date(2019, 1, 10), Date_Refused_Final_Signature_of_ICP=datetime.date(2019, 1, 10), Refused_Final_Signature_Comments='concern', Intervention_Outcome='Successful Contact', Monthly_Member_Contact_Y_N='Yes', Monthly_Member_Contact_Date=datetime.date(2019, 1, 10), Special_Projects_HHB_program='Baby Box Given', ICT_Meeting_Dates_Additional_Comments=NaT, _20='Yes', Date=datetime.date(2019, 2, 12), Targeted_Case_Management_Referral='Yes')