Я пытаюсь привести в порядок некоторые данные, в частности, взяв два столбца «мера» и «значение» и создавая больше столбцов для каждого уникального значения меры.
Пока у меня есть некоторый код python (3), который считывает данные и поворачивает их в желаемую форму - примерно. Этот код выглядит так:
import pandas as pd
#Load the data
df = pd.read_csv(r"C:\Users\User\Documents\example data.csv")
#Pivot the dataframe
df_pivot = df.pivot_table(index=['Geography Type', 'Geography Name', 'Week Ending',
'Item Name'], columns='Measure', values='Value')
print(df_pivot.head())
Это выводит:
Measure X Y Z
Geography Type Geography Name Week Ending Item Name
Type 1 Total US 1/1/2018 Item A 57 51 16
Item B 95 37 17
1/8/2018 Item A 92 8 32
Item B 36 49 54
Type 2 Region 1 1/1/2018 Item A 78 46 88
Это почти идеально, но для моей работы мне нужно поместить этот файл в программное обеспечение, и для программного обеспечения для правильного чтения данных ему нужны значения для каждой из строк, поэтому мне нужны значения столбцов для каждого из этих индексов, чтобы продлиться через ряды, вот так:
Measure X Y Z
Geography Type Geography Name Week Ending Item Name
Type 1 Total US 1/1/2018 Item A 57 51 16
Type 1 Total US 1/1/2018 Item B 95 37 17
Type 1 Total US 1/8/2018 Item A 92 8 32
Type 1 Total US 1/8/2018 Item B 36 49 54
Type 2 Region 1 1/1/2018 Item A 78 46 88
и т. Д.