Как я могу удалить дубликаты столбцов группы 3, используя два критерия (первые два столбца)? - PullRequest
0 голосов
/ 29 мая 2018

Это мой набор данных enter code here

Year created  Week created  SUM_New  SUM_Closed  SUM_Open
0          2018             1       17           0        82
1          2018             6       62          47        18
2          2018             6       62          47        18
3          2018             6       62          47        18
4          2018             6       62          47        18

В последних трех столбцах уже есть сумма за год и неделю.Мне нужно избавиться от дубликатов, чтобы таблица содержала уникальные значения (для примера выше):

Year created  Week created  SUM_New  SUM_Closed  SUM_Open
0          2018             1       17           0        82
4          2018             6       62          47        18

Я пытался сгруппировать данные, но это как-то работает неправильно и выполняет то, что мне нужно, но только для одного столбца.

df.groupby(['Year created', 'Week created']).size()

И вывод:

Year created  Week created
2017          48               2
              49              25
              50              54
              51              36
              52               1
2018          1               17
              2               50
              3               37

Но это всего лишь один столбец, и я не знаю, какой именно, потому что даже если я разделяю данные натри части и сделать ту же процедуру для каждой части я получаю одинаковый результат (как указано выше) для всех.

Ответы [ 2 ]

0 голосов
/ 29 мая 2018
df2 = df.drop_duplicates(['Year created', 'Week created', 'SUM_New', 'SUM_Closed'])
print(df2)

надеюсь, это поможет.

0 голосов
/ 29 мая 2018

Мне кажется, нужно drop_duplicates:

df = df.drop_duplicates(['Year created', 'Week created'])
print (df)
   Year created  Week created  SUM_New  SUM_Closed  SUM_Open
0          2018             1       17           0        82
1          2018             6       62          47        18
...