У меня есть эта проблема, я надеялся, что кто-то может помочь.
У меня очень большой фрейм данных (около 20000000 наблюдений) в R с примерно 43 столбцами, в четырех из этих столбцов мне нужно выяснить, существует ли более одного равного минимального значения ниже 200, тогда, если у нас есть строки, где более чем один столбец имеет одно и то же значение, соответствующее этому критерию. Мне нужно пометить эту строку в TRUE (в новом столбце флага). Обратите внимание, что эти столбцы содержат значения NA, и NA
s не должны использоваться (если NA присутствует в сравниваемых столбцах, возвращает NA)
цель состоит в том, чтобы найти значения в каждой строке для столбцов от a1 до a4 и определить, встречается ли минимальное значение, которое не превышает 200, в более чем одном столбце в строке
для простоты скажем, что так выглядят мои данные
head(mydata)
t1 a1 a2 a3 a4
34 NA NA NA NA
26 10 15 250 150
34 20 20 100 30
35 5 5 10 5
25 45 100 3 45
31 400 310 500 310
")
цель состоит в том, чтобы найти значения в каждой строке для столбцов от a1 до a4 и выяснить, встречается ли минимальное значение, которое не превышает 200, в более чем одном столбце в строке, если оно возвращает true, если нет, false
ожидаемый результат будет выглядеть так
head(mydata)
t1 a1 a2 a3 a4 flag
34 NA NA NA NA NA
26 10 15 250 150 FALSE
34 20 20 100 30 TRUE
35 5 5 10 5 TRUE
25 45 100 3 45 FALSE
31 400 310 500 310 FALSE
")
Заранее спасибо.