Я пытаюсь создать воронкообразную диаграмму, но сейчас мои данные находятся в широком формате. В нем есть пара групп, которые я хочу сравнить (например, A
и B
в приведенном ниже примере), и они находятся в разных масштабах, поэтому я хочу использовать пропорции, а также необработанные значения.
У меня есть начальная таблица, которая выглядит так:
| group | One | Two | Three |
|-------|-----|-----|-------|
| A | 100 | 75 | 50 |
| B | 10 | 7 | 6 |
|-------|-----|-----|-------|
Мне нужно, чтобы таблица выглядела так:
| group | stage | count | proportion of stage One |
|-------|-------|-------|-------------------------|
| A | One | 100 | 1 |
| A | Two | 75 | 0.75 |
| A | Three | 50 | 0.5 |
| B | One | 10 | 1 |
| B | Two | 7 | 0.7 |
| B | Three | 6 | 0.6 |
|-------|-------|-------|-------------------------|
Пропорция рассчитывается как значение каждой строки, деленное на максимальное значение для этой группы. На первом этапе всегда будет 100%, затем на втором этапе - это count
для этой строки, деленное на максимальное значение count
для этого значения группы.
Лучшее, что я мог сделать, это подключиться к базе данных в python и используйте Pandas, чтобы растопить стол, но я бы очень хотел сохранить все в сценарии SQL.
Я возился и добился нулевого прогресса на четыре слишком долго. Любая помощь приветствуется.