Groupby Две колонны - Парето комбинаций - PullRequest
0 голосов
/ 22 сентября 2018

Я довольно новичок в питоне.Я искал ответ на этот вопрос, но боюсь, что не знаю правильных ключевых слов, чтобы найти его, если он уже существует.

У меня есть pandas df, который состоит из столбца серийных номеров и некоторых параметров, которыми они обладают.Пример: SN1 имеет параметры A и B, SN2 имеет параметры A и C и т. Д.

Serial        Parameter  
SN1              A
SN1              B
SN2              C
SN2              B
SN3              D
SN4              A 
SN4              B 
SN5              D

Когда я выполняю df.groupby ([Serial, Parameter]). Sum (), я создаю новую таблицуэто удаляет дубликаты в «Serial» и дает более четкое представление о том, какая SN содержит какую комбинацию параметров.

Serial      Parameter
SN1         A 
            B
SN2         A
            C
            B
SN3         D
SN4         A 
            B
SN5         D 

Я заинтересован в создании новой таблицы из этой таблицы, которая показывает счетчик для всех комбинаций параметров, встречающихся в моем фрейме данных, чтобы я мог создать гистограмму, показывающую, какая комбинация встречается чаще всего.в меньшей степени.

Я думаю, это выглядело бы примерно так, где «Комбинация №» - это новый добавленный столбец для индексации каждой комбинации параметров.«Счетчик комбинаций» - это также добавленный столбец, который представляет собой счетчик частоты этого индекса, где остается комбинация nd-параметра, и просто показывает, какой комбинацией является комбинация.

 Combination #       Combination Count  Parameter 
    1                  2                  A
                                          B
                                          C
    2                  2                  D 
    3                  1                  A
                                          C
                                          B      

Есть ли у меня правильный подход, даже если я использую групповую игру?Некоторые советы будут полезны.

Спасибо!

РЕДАКТИРОВАТЬ: Для ясности спросить.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...