R: составление значений из строк фрейма данных - PullRequest
0 голосов
/ 23 февраля 2019

Я начал программировать на R вчера (буквально), и у меня возникла следующая проблема:

-У меня есть фрейм данных, содержащий R строк, и каждая строка содержит N значений.Строки идентифицируются первым и вторым полем, в то время как другие N-2 являются просто числовыми значениями или NA.

-Некоторые строки имеют идентичное первое поле и идентичное второе поле, что-то вроде:

row 1: a,b, third_field, .. ,last_field
row 2: a,b, third_field, .. ,last_field

правило состоит в том, что обычно в первой строке будут поля, содержащие несколько чисел и несколько NA, в то время как вторая строка будет также содержать NA и числа, но распределенные по-разному.

Что я пытаюсь сделатьсостоит в объединении двух строк (или записей) в соответствии с этими двумя правилами:

1) если обе строки имеют NA для данного поля, я сохраняю NA

2), если один издва имеет число, я использую это значение;если обе строки содержат одно и то же значение, я также сохраню его.

Как это сделать, не зацикливаясь на каждом поле каждой строки?(1М строк, десятых полей, возможно, закончится завтра).

Я не знаю, как лучше объяснить мою проблему.Я прошу прощения за длинное объяснение, большое спасибо.

РЕДАКТИРОВАТЬ: лучше, если я добавлю пример.Следующие две строки

a,b,NA,NA,NA,1,2 ,NA
a,b,NA,3 ,NA,1,NA,NA

должны стать

a,b,NA,3 ,NA,1,2 ,NA
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...