Объединение 2-х блоков данных по столбцам с питоном и пандами - PullRequest
0 голосов
/ 26 октября 2018

У меня есть два фрейма данных в пандах

df1:

           Genes         N1         N2        N3         N4        N5  \
1      100130426          0          0    0.2262          0         0   
2      100133144     6.0377     4.3819   15.9742     4.5751   14.5776   
3      100134869     3.9512     2.3768   12.3047     5.6267    4.8288   
4          10357   197.2475    87.8119   78.7874   328.9158  113.7614   
5          10431  1615.9822  1645.1704   769.866   722.7625  863.5845  

df2:

           Genes        T1        T2        T3        T4        T5        T6  \
1      100130426         0         0         0         0         0         0   
2      100133144    4.0315    1.4705         0    8.2678    5.3467    3.1702   
3      100134869   10.9554     9.111    7.5432    9.0772    8.2126    5.9363   
4          10357  128.3177  129.6157  144.8024    108.58  107.5162  153.8304   
5          10431   659.423  835.5713   900.873  878.8159  433.5901  579.3967 

Как вывести их на один CSV в этом формате?Обратите внимание, что столбец «Genes» остается прежним, а столбцы N находятся рядом с соответствующими им столбцами T.

           Genes         N1         T1        N2         T2        N3  \
1      100130426          0          0    0.2262          0         0   
2      100133144     6.0377     4.0315   15.9742     1.4705   14.5776   
3      100134869     3.9512    10.9554   12.3047      9.111    4.8288   
4          10357   197.2475   128.3177   78.7874   129.6157  113.7614   
5          10431  1615.9822    659.423   769.866   835.5713  863.5845  and so on...

У меня 25 столбцов данных, поэтому я хочу, чтобы выводимые столбцы были в следующем порядке:

['Genes', 'N1', 'T1', 'N2', 'T2', 'N3', 'T3', 'N4', 'T4', ..., 'N23', «T23», «N24», «T24», «N25», «T25»]

1 Ответ

0 голосов
/ 26 октября 2018

Вы можете сделать:

merged = df1.merge(df2).set_index('Genes')

merged = merged[sorted(merged.columns,key=lambda x: int(x[1:]))].reset_index()

Это позволит отсортировать столбцы по номеру после буквы по всем столбцам, кроме генного столбца:

       Genes         N1        T1         N2        T2        N3        T3  \
0  100130426     0.0000    0.0000     0.0000    0.0000    0.2262    0.0000   
1  100133144     6.0377    4.0315     4.3819    1.4705   15.9742    0.0000   
2  100134869     3.9512   10.9554     2.3768    9.1110   12.3047    7.5432   
3      10357   197.2475  128.3177    87.8119  129.6157   78.7874  144.8024   
4      10431  1615.9822  659.4230  1645.1704  835.5713  769.8660  900.8730   

         N4        T4        N5        T5        T6  
0    0.0000    0.0000    0.0000    0.0000    0.0000  
1    4.5751    8.2678   14.5776    5.3467    3.1702  
2    5.6267    9.0772    4.8288    8.2126    5.9363  
3  328.9158  108.5800  113.7614  107.5162  153.8304  
4  722.7625  878.8159  863.5845  433.5901  579.3967  
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...