У меня есть кадр данных, как показано ниже,
> df
A B C D E
1 1 2 3 4 5
2 4 5 6 7 7
3 7 8 9 8 9
где строки - это Гены, а столбцы - это Идентификаторы образцов, я хочу проиндексировать нормальные образцы / образцы заболевания. Нормальные образцы - это A, B, а образцы заболевания - это D & E (например). У меня есть файл Phenotypic следующим образом
> Pheno
sample status
1 A Normal
2 B Normal
3 C Unknown
4 D Diseased
5 E Diseased
Теперь мой вопрос: как индексировать выборки в 'df', скажем, например, == 0 для нормальной и == 1 для болезни в R на основе классификации файлов Pheno. (Индексирование образцов в файл Normal и Diseased из файла RNAseq raw count. Содержит 758 образцов в виде столбцов и 556789 генов в виде строк). Надеюсь, я уверен, было бы здорово, если бы вы мне помогли в этом. Большое спасибо за вашу помощь
С уважением,
Хорошего дня,
Дэйв.