Я пытаюсь найти общие границы между коэкспрессионными сетями генов. Вот игрушечный пример:
Dataset 1 Dataset 2 Dataset 3
A:B A:B A:B
D:E NA D:E
Итак, пересекая эти столбцы, A: B - это ребро, которое нужно включить, но не D: E.
Моя проблема заключается в том, что мои края могут быть представлены в любом направлении: либо A: B, либо B: A. У меня также есть A и B как отдельные столбцы. Таким образом, любой фрейм данных будет выглядеть примерно так:
Gene1 Gene2 Edge
A B A:B
или это:
Gene1 Gene2 Edge
B A B:A
Это означает, что при попытке пересечения вы можете получить что-то вроде следующего:
Dataset 1 Dataset 2 Dataset 3 Dataset 4 Dataset5
B:A A:B A:B B:A A:B
Соответствующие строки не будут работать, так как они будут считаться разными, даже если отношения все те же
Как мне установить подкадр данных, который позволяет мне находить пару генов независимо от порядка гена? Либо запросив строку «gene1: gene2», либо используя столбец с именами Gene1 и столбец с именами Gene2.