У меня есть data.frame, который выглядит следующим образом:
Gene Sample1 Sample2 Sample3 ........
a 1 5 7 ........
a 2 2 1 ........
a 8 5 0 ........
b 18 22 7 ........
c 76 2 27 ........
c 70 26 12 ........
.... ...... ...... ........
Есть ли способ взять медиану / среднее для повторяющихся имен генов, сохранив неповторяющиеся ?
Желаемый результат:
Gene Sample1 Sample2 Sample3 ........
a 2 5 1 ........
b 18 22 7 ........
c 73 14 19.5 ........
Например, для «a» я считал медиану, а для «c» среднее. Можно считать только среднее, потому что у меня много повторений. Моя точка зрения не в том, чтобы усреднить, когда есть имя гена в сингле. Как можно легко различить guish два случая?
Заранее спасибо!
Лучший