Я довольно новичок в питоне.Я искал ответ на этот вопрос, но боюсь, что не знаю правильных ключевых слов, чтобы найти его, если он уже существует.
У меня есть pandas df, который состоит из столбца серийных номеров и некоторых параметров, которыми они обладают.Пример: SN1 имеет параметры A и B, SN2 имеет параметры A и C и т. Д.
Serial Parameter
SN1 A
SN1 B
SN2 C
SN2 B
SN3 D
SN4 A
SN4 B
SN5 D
Когда я выполняю df.groupby ([Serial, Parameter]). Sum (), я создаю новую таблицуэто удаляет дубликаты в «Serial» и дает более четкое представление о том, какая SN содержит какую комбинацию параметров.
Serial Parameter
SN1 A
B
SN2 A
C
B
SN3 D
SN4 A
B
SN5 D
Я заинтересован в создании новой таблицы из этой таблицы, которая показывает счетчик для всех комбинаций параметров, встречающихся в моем фрейме данных, чтобы я мог создать гистограмму, показывающую, какая комбинация встречается чаще всего.в меньшей степени.
Я думаю, это выглядело бы примерно так, где «Комбинация №» - это новый добавленный столбец для индексации каждой комбинации параметров.«Счетчик комбинаций» - это также добавленный столбец, который представляет собой счетчик частоты этого индекса, где остается комбинация nd-параметра, и просто показывает, какой комбинацией является комбинация.
Combination # Combination Count Parameter
1 2 A
B
C
2 2 D
3 1 A
C
B
Есть ли у меня правильный подход, даже если я использую групповую игру?Некоторые советы будут полезны.
Спасибо!
РЕДАКТИРОВАТЬ: Для ясности спросить.