В настоящее время мы работаем над созданием панели инструментов в PowerBI для отображения статистики производительности.
У нас есть данные более 200 компаний за последние 3 года. Эти данные получены из вопросника. За эти годы мы разработали эту анкету и добавили в нее больше деталей.
Данные являются иерархическими (на 5 уровнях) и содержат информацию в эквиваленте полной занятости. Уровни переходят от 1 (самый общий) до уровня 5 (самый подробный). Например, категория на уровне 1 в данном примере - 411, но ее можно разбить на несколько более подробных уровней (411 -> 4111 -> 41112 -> 411123 -> 4111231).
ID Level1 Level2 Level3 Level4 Level5 Absolute value Relative value
1 411 4111 41112 411123 4111231 2 20%
1 411 4111 41112 411123 4111232 3 30%
2 411 4111 41112 411123 4 40%
Как вы видите в примере, ID_2 не сообщал данные на самом низком уровне, но ID 1 сделал. Вот как данные были получены с течением времени. Мы не знаем, как значение 411123 для идентификатора 2 делится на 4111231 и 4111232.
Цель состоит в том, чтобы получить среднее значение относительного значения.
Наша проблема:
Если мы вычислим средние значения, которые пойдут не так, как в родительской строке, в средние включается больше организаций, а в дочерней строке - меньше организаций. Это неправильно в матричной таблице (см. Ниже).
Category Average of the relative value
411123 45% (Both ID 1 and ID 2 included)
4111231 20% (Only ID 1 included)
4111232 30% (Only ID 1 included)
20% и 30% не совпадают с 45% на основном уровне (411123).
Как мы хотим решить эту проблему: мы хотели бы использовать соотношение ID 1 (то есть 20% / 50% для 411231 и 30% / 50% для 4111232) и применить его к ID 2 (40%).
Можете ли вы помочь нам?
Если у вас есть какие-либо вопросы, пожалуйста, сообщите нам.
Заранее спасибо,
С уважением,
Floris