У меня есть два фрейма данных:
df1
SYMBOL seqnames start end SampleID
SPATA21 1 16736303 16736303 eAPD114
E2F2 1 23836607 23836607 eAPD114
FCN3 1 27701288 27701288 eAPD120
MARCKSL 1 32800671 32800671 KAPD144
MARCKSL 1 32800671 32800671 eAPD184
LRRC40 1 70644607 70644607 eAPD184
KREMEN1 22 29536275 29536275 eAPD005
KIF14 1 200569584 200569584 eAPD081
RGS7BP 5 63802465 63802465 YAPD025
PCDHB6 5 140531231 140531231 YAPD025
SERPINB4 18 61305310 61305310 eAPD081
df2
SYMBOL seqnames start end
SPATA21 1 16736303 16736303
E2F2 1 23836607 23836607
FCN3 1 27701288 27701288
MARCKSL 1 32800671 32800671
LRRC40 1 70644607 70644607
KREMEN1 22 29536275 29536275
SERPINB4 18 61305310 61305310
SERPINB4 21 61305310 61305310
Я хочу сопоставить df1 с df2 и представить каждый SampleID как отдельный столбец с заполнением 0 и 1, если есть соответствие между df1 и df2:
Ожидаемый результат:
SYMBOL seqnames start end eAPD114 eAPD120 KAPD144 eAPD184 eAPD005 eAPD081 YAPD025
SPATA21 1 16736303 16736303 1 0 0 0 0 0 0
E2F2 1 23836607 23836607 1 0 0 0 0 0 0
FCN3 1 27701288 27701288 0 1 0 0 0 0 0
MARCKSL 1 32800671 32800671 0 0 1 1 0 0 0
LRRC40 1 70644607 70644607 0 0 0 1 0 0 0
KREMEN1 22 29536275 29536275 0 0 0 0 1 0 0
SERPINB4 18 61305310 61305310 0 0 0 0 0 1 0
SERPINB4 21 61305310 61305310 0 0 0 0 0 0 0
Я пробовал использовать упомянутый метод поворота здесь . Но не работало качественно