Как отфильтровать строки, в которых хотя бы определенное количество наблюдений больше определенного значения? - PullRequest
0 голосов
/ 13 января 2019

У меня есть фрейм данных с 9 столбцами и множеством строк. Я хочу отфильтровать все строки с наблюдениями больше 3,0 в как минимум 3 столбца. Какие условные операторы я должен использовать для подмножества моего фрейма данных?

Так как я n00b, я только придумал это: data_frame[data_frame > 3,]

Очевидно, это дает мне все строки, для которых все значения> 2, независимо от того, что мне действительно нужно.

Спасибо!

Ответы [ 2 ]

0 голосов
/ 15 января 2019

Я подумал, что вы также можете объединить логические операторы:

Данные [rowSums (данные> 2)> = 3,]

Таким образом, вы можете выбрать из кадра данных строки, для которых сумма наблюдений (больше 2) встречается три или более раз. И нет спецификации для столбцов.

0 голосов
/ 14 января 2019

Логический оператор, в данном случае мозг. Я использовал sum(rowSum(data))>x # x = сумму доступных столбцов времен ограничения.

...