группировка строк и суммирование значений по одному столбцу в python - PullRequest
0 голосов
/ 03 января 2019

У меня большой текстовый файл, подобный этому:

small example:

chr4    53382   53385   47  chr4    53382   53385   ZNF595  ENST00000509152.2   annotated
chr16   103500  103550  27  chr16   103475  103586  POLR3K  ENST00000293860.5   annotated
chr16   103550  103586  43  chr16   103475  103586  POLR3K  ENST00000293860.5   annotated
chr16   103584  103600  43  chr16   103584  104058  SNRNP25 ENST00000293861.3   annotated
chr16   103900  103950  37  chr16   103584  104058  SNRNP25 ENST00000293861.3   annotated

Я хочу сгруппировать строки на основе 8-го столбца и суммировать значения 4-го столбца изстроки, принадлежащие к одной группе.

Я пробовал этот код:

b = pd.read_csv("myfile.txt", sep='\t')
df = d.groupby(7)(3).sum()
df.to_csv('outfile.txt', sep='\t', index=None)


chr4    53382   53385   47  chr4    53382   53385   ZNF595  ENST00000509152.2   annotated
chr16   103550  103586  70  chr16   103475  103586  POLR3K  ENST00000293860.5   annotated
chr16   103584  103600  80  chr16   103584  104058  SNRNP25 ENST00000293861.3   annotated
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...