Вы отметили свой вопрос как pandas
, поэтому я предполагаю, что ваши данные уже имеют форму DataFrame
.Если это так, следующая команда должна выполнить:
df.groupby(['env', (df['rating'].isin(['P1', 'P2']))]).size().rename(index={True: 'P1/P2', False: 'Total'}, level=1)
(Предполагается, что ваш DataFrame
имеет имя df
, а ваши столбцы "Environment / s затронут" и "Rating" - env
и rating
соответственно.)
Выполняется группировка по первым уникальным значениям столбца env
, а затем по столбцу rating
в зависимости от того, является ли содержащееся в нем значение «P1» или'P2' или нет.Затем он подсчитывает количество строк в каждой подгруппе.
Если ваши данные еще не в форме DataFrame
, вам нужно будет загрузить их как одну из CSV, что можно сделать с помощьюследующая команда:
df = pd.read_csv(file_path)
Возможно, вам придется немного подправить аргументы, в зависимости от формата вашего файла;документ можно найти здесь .