Я только начал использовать Python, и у меня возникла проблема, связанная с набором данных, с которым я работаю.
У меня есть следующий набор данных:
C1 C2 C3 C4 C5 C6
99 069 99002068 3348117 3230802 T6
99 069 99002063 4599974 178885 T4
99 069 99002063 4599974 4606066 T4
99 069 99002063 4599974 236346 T4
99 069 99002063 4599974 310114 T4
Iнеобходимо сгруппировать по транспонированному столбцу C5 несколько столбцов на основе группировки по столбцам C1, C2, C3, C4, C6.
Код, который я написал до сих пор, следующий:
# load plugins
import pandas as pd
# import CSV
data = pd.read_csv(
"C:/Users/mcatuogno/Desktop/lista_collegamenti_onb.csv",
sep=";",
header=None,
dtype=str,
usecols=[0, 1, 2, 3, 4, 5],
names=["C1", "C2", "C3", "C4", "C5", "C6"]
)
# sort values
dataSort = data.sort_values(["C1", "C2", "C3", "C4"])
# transpose column based on group by function
dataTranspose = dataSort.groupby(["C1", "C2", "C3", "C4", "C6"])["C5"].apply(list)
С кодом выше результат будет
C1 C2 ... C6 C5
99 000 ... 09900000001100 [102995, 102997, 102996]
99 000 ... 09900000001135 [103042]
Я не знаю, как я могу разбить столбец C5 на несколько столбцов, каждый со следующим именем CN_1, CN_2, ..., CN_x.
Какую функцию Python я могу использовать?
Заранее спасибо!