Подсчет букв в текстовом файле - PullRequest
0 голосов
/ 23 октября 2019

Здравствуйте, я пытаюсь написать код, который может считать буквы в текстовом файле.

Я написал код, но он учитывает только строчные буквы. я пробовал использовать нижнюю функцию, но безуспешно

import numpy as np

def letterFrequency(filename):
    letters="abcdefghijklmnopqrstuvwxyz"

    filein = open(filename, "r")
    lines = filein.readlines()
    smalltxt = "".join(lines)
    totalOccurrences=0
    v=[]

    for i in letters:
        occurrences=smalltxt.count(i)
        totalOccurrences=totalOccurrences + occurrences
        v.append(occurrences)

    v=np.array([v])
    freq=(v/totalOccurrences)*100

    return  freq

print(letterFrequency("small_text.txt"))

Выходное значение составляет 7,74%, но ожидаемое значение должно составлять 8,1%. Я верю, потому что считаются только строчные буквы

1 Ответ

3 голосов
/ 23 октября 2019

Если вы хотите посчитать алфавиты с нечувствительной к регистру схемой, просто преобразуйте их в один регистр. исправление в строке.

smalltxt = "".join(lines).lower()

должно выполнить работу.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...