Добавление переменной с отсутствующими наблюдениями к существующим пандам df без потери наблюдений в большем df - PullRequest
1 голос
/ 09 ноября 2019

У меня есть два кадра данных. Один вызвал ENFORE с 139 наблюдениями:

citation    Enfore
0170/0952   1
0175/0686   1
0184/0521   1
0183/0726   1
0178/0595   0

И еще один фрейм данных называется CITATIONS с 668 наблюдениями, которые также имеют цитирование в столбце, но не Enfore. Все ссылки в ENFORE находятся во фрейме данных CITATIONS.

Я хотел бы добавить столбец Enfore во фрейм данных CITATIONS и заполнить наблюдения, отсутствующие в фрейме данных ENFORE, знаком «X».

Использование различных вариантов этого кода (объединение и объединение)

enfore_merged = pd.merge(enfore , harrington_citations, on = 'citation')

Мне не удалось создать фрейм данных, который я описал выше.

1 Ответ

1 голос
/ 09 ноября 2019

Вы почти у цели:

enfore_merged = harrington_citations.merge(enfore, how='left', on='citation')
enfore_merged['Enfore'] = enfore_merged['Enfore'].fillna('X')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...