Я пытаюсь объединить два набора данных в один на основе уникального идентификатора.В одной таблице у меня есть список пациентов и некоторая информация, например, даты поступления.В другом у меня есть список лекарств, которые они получили, вместе с отделением в больнице и т. Д. У каждого есть уникальный медицинский идентификатор, который связывает их вместе.Как я могу использовать python для добавления всех лекарств, вводимых пациенту, в основную электронную таблицу, в идеале в одну колонку с надписью «наркотики»?
Я попробовал следующее, но он не поместил их в отдельный столбец, и, похоже, не существует шаблона в том, как он обрабатывает даты.Вместо этого он создал несколько копий пациента.Кроме того, похоже, что он не был скопирован среди пациентов, которых нет в обоих исходных файлах.
import pandas as pd
%pylab inline
drug_df = pd.read_excel(
'C:/Users/Documents/Antibiotic Data.xls',
parse_dates=[7, 8, 11, 17, 18],
infer_datetime_format=True)
main_df = pd.read_excel(
'C:/Users/Documents/Main Data.xls'
parse_dates = [2, 3, 4],
infer_datetime_format = True)
merged = drug_df.merge(main_df, on="MRN")
merged.to_csv("merged.csv", index=False)
Вот ссылка на некоторые базовые таблицы, которые должны дать вам представление о том, что яНачинаю и заканчиваю с.
https://1drv.ms/f/s!ApoCMYBhswHzhokWfC6UILHhEqV_eA
Любые подсказки, как двигаться вперед отсюда?
Спасибо,
Callum