У меня есть такой набор данных:
category UK US Germany
sales 100000 48000 36000
budget 50000 20000 14000
n_employees 300 123 134
diversified 1 0 1
sustainability_score 22.8 38.9 34.5
e_commerce 37000 7000 11000
budget 25000 10000 10000
n_employees 18 22 7
traffic 150 mil 38 mil 12500
subsidy 33000 26000 23000
budget 14000 6000 6000
own_marketing 0 0 1
В наборе данных переменная продаж соответствует продажам из головного квартала.
e_commerce
- это продажи e-commerce
и budget
сразу после e_commerce
, которые фактически являются бюджетом e_commerce
раздела компании. То же относится и к subsisdy
, переменная subsidy
соответствует продажам subsidy
, а переменная budget
после subsidy
является бюджетом subsidy
. Я хочу преобразовать набор данных в нечто вроде этого (если мы возьмем пример Великобритании):
UK_main_sales UK_main_budget ... UK_e_commerce_sales UK_e_commerce_budget ...
100000 500000 37000 250000
и так далее. Я пытался классифицировать переменные из разных отделов, отслеживая переменную budget
, так как она всегда появляется сразу после отправителя, но мне это не удалось.
Полный список переменных для Великобритании должен быть таким:
UK_main_sales
UK_main_budget
UK_main_n_employees
UK_main_diversified
UK_main_sustainability_score
UK_e_commerce (we could also add sales but I think it is simpler without sales)
UK_e_commerce_budget
UK_e_commerce_n_employees
UK_e_commerce_traffic
UK_subsidy
UK_subsidy_budget
UK_subsidy_own_marketing
Есть идеи?