У меня огромный массив данных, который выглядит следующим образом:
Gene | Treatment | Control
A1CF| 6.643735| 6.065211
A1CF| 8.122326| 7.443722
A1CF| 6.247434| 5.647067
A1CF| 5.311160| 5.432942
A1CF| 6.048126| 6.805895
A1CF| 5.414253| 5.583502
A1CF| 7.143737| 4.719824
A1CF| 7.071972| 6.876549
A1CF| 4.079834| 6.725724
A1CF| 6.085052| 5.128936
ABCB1| 8.184414| 7.454422
ABCB1| 7.168527| 5.343675
ABCB1| 8.195312| 7.897611
ABCB1| 8.348520| 7.894995
ABCB1| 4.380701| 6.256692
ABCB1| 4.141235| 7.065211
ABCB1| 7.352853| 6.983843
ABCB1| 5.896122| 6.256692
ABCB1| 6.537364| 6.523796
ABCB1| 6.156185| 7.120003
И подходит для ~ 8000 данных.
У меня есть 2 разных вопроса для этого кадра данных:
1) Я хотел бы выбрать имя гена и соответствующее значение обработки, а затем вставить только значение обработки в новый столбец при удалении значения, которое обрабатывается.т.е. выберите ген ABCB1 и соответствующие значения обработки, затем вставьте его в новый столбец с именем «ABCB1».Но при этом мне бы не хотелось, чтобы значения ABCB1 Treatment начинались с 1-го ряда.Данные должны по-прежнему соответствовать ABCB1, но только под другим столбцом.
2) Выберите значения столбца обработки между 10:20, затем обрежьте эти значения и вставьте их в новый столбец с именем "ABCB1".
С наилучшими пожеланиями.
Я пробовал пакет dplyr
с mutate()
, transmute()
, но не смог добиться успеха.