Я начал программировать на R вчера (буквально), и у меня возникла следующая проблема:
-У меня есть фрейм данных, содержащий R строк, и каждая строка содержит N значений.Строки идентифицируются первым и вторым полем, в то время как другие N-2 являются просто числовыми значениями или NA.
-Некоторые строки имеют идентичное первое поле и идентичное второе поле, что-то вроде:
row 1: a,b, third_field, .. ,last_field
row 2: a,b, third_field, .. ,last_field
правило состоит в том, что обычно в первой строке будут поля, содержащие несколько чисел и несколько NA, в то время как вторая строка будет также содержать NA и числа, но распределенные по-разному.
Что я пытаюсь сделатьсостоит в объединении двух строк (или записей) в соответствии с этими двумя правилами:
1) если обе строки имеют NA для данного поля, я сохраняю NA
2), если один издва имеет число, я использую это значение;если обе строки содержат одно и то же значение, я также сохраню его.
Как это сделать, не зацикливаясь на каждом поле каждой строки?(1М строк, десятых полей, возможно, закончится завтра).
Я не знаю, как лучше объяснить мою проблему.Я прошу прощения за длинное объяснение, большое спасибо.
РЕДАКТИРОВАТЬ: лучше, если я добавлю пример.Следующие две строки
a,b,NA,NA,NA,1,2 ,NA
a,b,NA,3 ,NA,1,NA,NA
должны стать
a,b,NA,3 ,NA,1,2 ,NA