Итак, у меня есть две таблицы Excel, которые я собираюсь объединить на своем MacBook. Они довольно большие. Один имеет размеры (42912, 6)
, а другой имеет размеры (41424,7)
. Поэтому вот несколько примеров того, как они выглядят:
Таблица A
| Country | Continent |
|------------- |--------------- |
| UK | Europe |
| France | Europe |
| Germany | Europe |
| USA | North America |
| New Zealand | Oceania |
Таблица B
| Country | City | Population |
|------------- |---------- |------------ |
| UK | London | 8,900,000 |
| | Bristol | 53,907 |
| France | Paris | 2,141,000 |
| USA | New York | 8,623,000 |
| New Zealand | Auckland | 1,657,000 |
Вы можете увидеть некоторые различия между два. Например, хотя в таблице A перечислены 5 стран, в таблице B отсутствует одна из них - Germany
. К тому же. В таблице B есть 2 города, перечисленные в UK
, где в таблице A только одна строка.
По сути, я хочу иметь возможность объединить две таблицы, чтобы они выглядели так:
| Country | Continent | City | Population |
|------------- |--------------- |---------- |------------ |
| UK | Europe | London | 8,900,000 |
| | | Bristol | 53,907 |
| France | Europe | Paris | 2,141,000 |
| Germany | Europe | | |
| USA | North America | New York | 8,623,000 |
| New Zealand | Oceania | Auckland | 1,657,000 |
Две таблицы объединяются строкой / столбцом Country
, которые они оба имеют общее, эффективно добавляя оставшиеся релевантные строки из таблицы B в таблицу A.
Когда в таблице A есть строка, которой нет в таблице B, столбцы просто остаются пустыми (Germany
строка как пример). Когда в таблице B несколько строк в одной и той же стране, в таблице A создаются дополнительные строки (например, UK
).
Я был бы очень признателен за помощь в понимании того, как я могу объединить эти два ( учитывая, что у них более 40 тыс. строк в каждой), вместо того, чтобы делать это построчно в Excel, что заняло бы целую вечность.
Я очень рад работать с Python или Matlab et c., Или даже проще - способ сделать это в Excel для Ma c.
Спасибо!