У меня есть некоторые данные о продажах, в которых ошибки, зарегистрированные в торговой точке, исправляются впоследствии, и набор данных по-прежнему содержит записи для первоначальной ошибки, а затем дубликат ошибки, но с отрицательным значением цены. Как я могу удалить эти наблюдения условно, чтобы «если цена <0, удалить наблюдение и соответствующее наблюдение, где цена = цена * -1, дата = дата, тип = тип, вес = вес» </p>
Данные структурированы как
Date Type Weight Price
5/5/16 A 15 34
5/5/16 A 15 -34
5/5/16 B 15 43
Другая проблема заключается не только в том, что отредактированные ошибки существуют в виде дубликатов, но и в типе, весе и ценовых записях есть несколько действительных дубликатов. например продажа может быть сделана в тот же день за 10 предметов типа А по 15 фунтов каждая за 34 доллара. - Я добавил столбец для подсчета количества дубликатов абсолютных значений test2 <- test%>% dplyr :: group_by (Дата, Тип, Вес, ABS_Price)%>% dplyr :: mutate (replicate = seq (n ()) )) так как бы я закодировал 'если наблюдение имеет цену <0, то удалите наблюдение, где replicate = x-1' </p>