Как мне использовать Python для объединения двух таблиц Excel на основе общего идентификатора? - PullRequest
0 голосов
/ 22 мая 2018

Я пытаюсь объединить два набора данных в один на основе уникального идентификатора.В одной таблице у меня есть список пациентов и некоторая информация, например, даты поступления.В другом у меня есть список лекарств, которые они получили, вместе с отделением в больнице и т. Д. У каждого есть уникальный медицинский идентификатор, который связывает их вместе.Как я могу использовать python для добавления всех лекарств, вводимых пациенту, в основную электронную таблицу, в идеале в одну колонку с надписью «наркотики»?

Я попробовал следующее, но он не поместил их в отдельный столбец, и, похоже, не существует шаблона в том, как он обрабатывает даты.Вместо этого он создал несколько копий пациента.Кроме того, похоже, что он не был скопирован среди пациентов, которых нет в обоих исходных файлах.

import pandas as pd
%pylab inline

drug_df = pd.read_excel(
    'C:/Users/Documents/Antibiotic Data.xls',
    parse_dates=[7, 8, 11, 17, 18],
    infer_datetime_format=True)
main_df = pd.read_excel(
    'C:/Users/Documents/Main Data.xls'
    parse_dates = [2, 3, 4],
    infer_datetime_format = True)
merged = drug_df.merge(main_df, on="MRN")
merged.to_csv("merged.csv", index=False)

Вот ссылка на некоторые базовые таблицы, которые должны дать вам представление о том, что яНачинаю и заканчиваю с.

https://1drv.ms/f/s!ApoCMYBhswHzhokWfC6UILHhEqV_eA

Любые подсказки, как двигаться вперед отсюда?

Спасибо,

Callum

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...