Я хочу сгенерировать диаграмму Санки на основе данных о продукте, которые выглядят следующим образом.
id begin_date status
1 01.02.2020 a
1 10.02.2020 b
1 17.02.2020 c
2 02.02.2020 d
2 06.03.2020 b
2 17.04.2020 c
Для ваших экспериментов:
pd.DataFrame([[1, '2020-02-01', 'a'], [1, '2020-02-10', 'b'], [1, '2020-02-17', 'c'], [2, '2020-02-02', 'd'], [2, '2020-03-06', 'b'],[2, '2020-04-17', 'c']], columns=['id', 'begin_date', 'status'])
Посмотрев на это объяснение: Нарисуйте Санки Диаграмма из фрейма данных Я хочу построить фрейм данных «Исходное-целевое-значение», выглядящий следующим образом. Чтобы лучше понять, я не преобразовывал Source и Target в целые числа.
# with Source = previous status
# with Target = next status
# with Value = count of IDs that transition from Source to Target
Source Target Value Link Color
a b 1 rgba(127, 194, 65, 0.2)
b c 2 rgba(127, 194, 65, 0.2)
d b 1 rgba(211, 211, 211, 0.5)
Проблема заключается в генерации Source, Target и Value. Source
и Target
должны быть переходом статуса с a
на b
. Value
- это количество id
, выполняющих этот переход.
Как лучше всего это сделать?
РЕДАКТИРОВАТЬ: Используя онлайн-генератор, результат будет выглядеть следующим образом : введите описание изображения здесь