У меня есть этот набор данных, который я хочу преобразовать, поэтому я просто выбрал фрагмент того, как он выглядит. Таким образом, у нас есть столбец с именем Больница, в котором есть те 4 строки, которые повторяются до конца кадра данных. Я хочу преобразовать так, чтобы все данные могли быть сохранены только в первой строке, которая называется prelim_arm_1, и удалили оставшиеся руки из 3 строк.
import pandas as pd
import numpy as np
# intialise data of lists.
data = {'Hospital':['prelim_arm_1' , '24_hour_review_arm_1','48_hour_review_arm_1',
'72_hour_review_arm_1','discharge_informat_arm_1','prelim_arm_1' ,
'24_hour_review_arm_1','48_hour_review_arm_1',
'72_hour_review_arm_1','discharge_informat_arm_1'],
'Bug_Hosp':['133', 'NAN' , 'NAN', 'NAN', 'NAN','133', 'NAN' , 'NAN', 'NAN', 'NAN'],
'code':['G45','NAN' ,'NAN','NAN', 'NAN', 'G45','NAN' ,'NAN','NAN', 'NAN'],
'cont':['T256','NAN' ,'NAN','NAN', 'NAN','T256','NAN' ,'NAN','NAN', 'NAN'],
'IPC':['NAN','NAN' ,'NAN','567TY', 'NAN','NAN','NAN' ,'NAN','567Tu', 'NAN'],
'NO_CT':['NAN','NAN' ,'NAN','NAN', '5667','NAN','NAN' ,'NAN','3456', 'NAN'],
}
# Create DataFrame
df_final = pd.DataFrame(data)
# Print the output.
print(df_final)
Окончательный набор данных должен выглядеть следующим образом
import pandas as pd
import numpy as np
# intialise data of lists.
data = {'Hospital':['prelim_arm_1'],
'Bug_Hosp':['133'], 'code':['G45'],
'cont':['T256'],
'IPC':['567TY'],
'NO_CT':['5667']}
# Create DataFrame
df_final = pd.DataFrame(data)
# Print the output.
print(df_final)
Набор данных огромен с повторяющимися рядами ветвей, но я хочу, чтобы для каждой группы из 4 строк он должен сохраняйте данные только на prelim_arm_1 и удаляйте остальные 3 ряда строчек . итоговая таблица будет иметь только prelim_arm_1 с данными по группе из 4 рук.