Удаление ненужных двойных кавычек из ключей в словаре - Python - PullRequest
0 голосов
/ 25 июня 2018

Цель моей программы - создать словарь предметов (ключ) и их количество (значения). Ключи извлекаются из текстового файла, в котором они организованы в виде списков.

Пример : ['synonymous_variant'] ['splice_region_variant & synonymous_variant' ['synonymous_variant'] (каждый список находится на новой строке без разделителей)

Код:

from collections import Counter
file = open('/home/becquart/Stagiaire_refinement_construct_peptides/Travail5/RE__[Allogenomics]_travail_Vcf/results.txt', 'r').read()

for char in '""-.,\n[]':
    file = file.replace(char,' ')

for i in char:
    file = file.replace('""', ' ')


file = file.lower()

word_list = file.split()

d = dict(Counter(word_list).most_common())

print d

Вывод выглядит примерно так: {"'coding_sequence_variant&3_prime_utr_variant'": 6, "'inframe_insertion&nmd_transcript_variant'": 17 и т. Д.

Я бы хотел удалить " из ключей, но мне трудно понять, как я новичок в программировании ... Я был бы очень рад, если бы смог решить эту проблему.

Заранее спасибо!

Редактировать : Входной файл здесь: https://ufile.io/v1tm0

...