Каков наилучший способ подсчитать количество записей на 3 фреймах данных, которые не являются общими? - PullRequest
0 голосов
/ 09 июля 2019

У меня есть три кадра данных, которые представляют собой сводку различных статистических данных о странах.Я создал объединение трех фреймов данных в столбце «Название страны».Но я хочу знать, сколько записей существует в трех исходных фреймах данных, которые были исключены из объединения.Какой код лучше всего посчитать?

1 Ответ

0 голосов
/ 11 июля 2019

Поскольку вы не предоставили свой код и кадры данных, неясно, каков результат объединения трех ваших данных.Кроме того, вы должны учитывать, что панды по умолчанию join оставлены в левом соединении, поэтому перестановка кадров данных может изменить результаты.

Однако это не меняет решения.Я предполагаю, что у вас есть фрейм данных с именем df (который, как вы сказали, вы сделали с помощью объединения), и вы ищете все отсутствующие индексы в df, которые существуют на этих трех фреймах данных.

Первый шаг - объединение всех фреймов данных с * 1007.* параметр.выходные данные должны иметь все индексы для всех фреймов данных ([df1,df2,df3]).Второй шаг так же прост, как получить разницу по индексам для full_df и df.

Вот код

   full_df = pd.join([df1,df2,df3], how = 'outer') 
   missing_indices = full_df.index.difference(df.index)
   print(missing_indices)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...