У меня есть список файлов, содержащих определенные гены, и я хочу создать матрицу бинарных отношений в R, которая показывает присутствие каждого гена в каждом файле.
Например, вот мои файлы aaa
, bbb
, ccc
и ddd
и связанные с ними гены.
aaa=c("HERC1")
bbb=c("MYO9A", "PKHD1L1", "PQLC2", "SLC7A2")
ccc=c("HERC1")
ddd=c("MACC1","PKHD1L1")
Я хотел бы знать, какую команду я мог бы использовать в R для создания бинарной таблицы отношений, как показано на следующем рисунке:
, где значение 1 означает ассоциацию, а значение 0 означает неассоциирование.
Как я могу сделать эту операцию в R?
Я пытался использовать table(aaa,bbb,ccc,ddd)
, но это не сработало. Р сказал:
Ошибка в таблице (aaa, bbb, ccc, ddd): все аргументы должны иметь
одинаковая длина
РЕДАКТИРОВАТЬ : Спасибо @akrun за полезный ответ! Я воспользуюсь этим вопросом, чтобы попросить помощи по другой проблеме , и я уверен, что вы, ребята, справитесь очень быстро. Для второй части моего анализа мне нужно сгенерировать еще одну таблицу, в которой, для каждой пары генов, я присваиваю значение 1, если они оба присутствуют в конкретном файле, и 0 другим . Следуя примеру, который я привел ранее, эта новая таблица должна выглядеть примерно так (я переношу ее для пояснения):
Кто-нибудь знает быстрый способ получения этой новой бигенической таблицы в R, начиная с команд, которые вы, ребята, уже предоставили мне? Спасибо!