конвертировать недопустимые ячейки в "" (пусто или пропустить) - PullRequest
0 голосов
/ 04 апреля 2019

Я делаю ниже, в настоящее время; успешно отбрасываю весь ряд с моим if in - но, оказывается, мне не нужно отбрасывать весь ряд .. Как я могу обрабатывать ячейки конкретно.


Как я могу сохранить ту же логику, но применить к CELL ... преобразовать ячейки N/A, NaT и NaN в пустые?

for row in excel_data.itertuples():
    ids = row.IDS
    total_records += 1

    if ids in ("", " ", "N/A", "NaT", "NaN", None) or math.isnan(ids):
        # print(f"Invalid record: {row}")
        num_invalid_records += 1
        # total_invalid = num_invalid_records + dup_count
        excel_data = excel_data.drop(excel_data.index[row.Index])
        # continue
    else:
        num_valid_records += 1
        continue   

Мои данные выглядят так: (ниже) Как вы можете видеть, есть N / As, которые, похоже, переводятся как «NaT» или «Nan» в Пандах - я просто хотел бы преобразовать их в пустые или «» или даже пропустить как-нибудь, если это возможно ....

enter image description here

В пандах фрейм данных будет выводить вот так (я пропустил некоторые важные записи, но вы поняли идею) .

External_Referral='qweryt', Transitions_Planning='NF', Date_ICP_ICT_Signed_by_Member__Caregiver=datetime.date(2019, 1, 10), Date_Refused_Final_Signature_of_ICP=datetime.date(2019, 1, 10), Refused_Final_Signature_Comments='concern', Intervention_Outcome='Successful Contact', Monthly_Member_Contact_Y_N='Yes', Monthly_Member_Contact_Date=datetime.date(2019, 1, 10), Special_Projects_HHB_program='Baby Box Given', ICT_Meeting_Dates_Additional_Comments=NaT, _20='Yes', Date=datetime.date(2019, 2, 12), Targeted_Case_Management_Referral='Yes')

1 Ответ

0 голосов
/ 05 апреля 2019

Я полагаю, что excel_data - это Pandas Dataframe.

Если это так, вы можете использовать функцию Pandas fillna () в столбце IDS.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...