У меня большой текстовый файл, подобный этому:
small example:
chr4 53382 53385 47 chr4 53382 53385 ZNF595 ENST00000509152.2 annotated
chr16 103500 103550 27 chr16 103475 103586 POLR3K ENST00000293860.5 annotated
chr16 103550 103586 43 chr16 103475 103586 POLR3K ENST00000293860.5 annotated
chr16 103584 103600 43 chr16 103584 104058 SNRNP25 ENST00000293861.3 annotated
chr16 103900 103950 37 chr16 103584 104058 SNRNP25 ENST00000293861.3 annotated
Я хочу сгруппировать строки на основе 8-го столбца и суммировать значения 4-го столбца изстроки, принадлежащие к одной группе.
Я пробовал этот код:
b = pd.read_csv("myfile.txt", sep='\t')
df = d.groupby(7)(3).sum()
df.to_csv('outfile.txt', sep='\t', index=None)
chr4 53382 53385 47 chr4 53382 53385 ZNF595 ENST00000509152.2 annotated
chr16 103550 103586 70 chr16 103475 103586 POLR3K ENST00000293860.5 annotated
chr16 103584 103600 80 chr16 103584 104058 SNRNP25 ENST00000293861.3 annotated