Я создаю файл Excel для создания панели веб-аналитики, и моя текущая проблема: Как группировать страны по различным регионам?Например: EMEA, APAC, AMER
У меня есть два файла Excel.В первом есть столбцы: account_id
, external/internal
и country_list
.
Во втором файле также содержится список стран и их соответствующих регионов (EMEA, APAC и т. Д.) countries
, regions
Я хотел бы сравнить столбец country_list
из файла 1 со столбцом countries
из файла 2, и если значения совпадают, то следует взять значение в столбце регионов.Например: если country_list
и countries
оба содержат "Германия", то значение должно быть EMEA.
До сих пор я начал следующим образом:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from pandas import ExcelWriter
from pandas import ExcelFile
accounts = pd.read_excel('accountids_with_properties.xlsx', sheetname='accountids_with_properties')
CountryGroups = pd.read_excel('country_list.xlsx', sheetname='country_list')
def groupCountry(col):
for col in accounts.index[3]:
if col = CountryGroups.index[0]: