Цель моей программы - создать словарь предметов (ключ) и их количество (значения). Ключи извлекаются из текстового файла, в котором они организованы в виде списков.
Пример : ['synonymous_variant'] ['splice_region_variant & synonymous_variant' ['synonymous_variant'] (каждый список находится на новой строке без разделителей)
Код:
from collections import Counter
file = open('/home/becquart/Stagiaire_refinement_construct_peptides/Travail5/RE__[Allogenomics]_travail_Vcf/results.txt', 'r').read()
for char in '""-.,\n[]':
file = file.replace(char,' ')
for i in char:
file = file.replace('""', ' ')
file = file.lower()
word_list = file.split()
d = dict(Counter(word_list).most_common())
print d
Вывод выглядит примерно так: {"'coding_sequence_variant&3_prime_utr_variant'": 6, "'inframe_insertion&nmd_transcript_variant'": 17
и т. Д.
Я бы хотел удалить "
из ключей, но мне трудно понять, как я новичок в программировании ... Я был бы очень рад, если бы смог решить эту проблему.
Заранее спасибо!
Редактировать :
Входной файл здесь: https://ufile.io/v1tm0