Question

Я пытаюсь сделать инструмент, который находит частоты букв в каком-то типе зашифрованного текста. Предположим, что все строчные буквы a-z без цифр. Закодированное сообщение в текстовом файле

Я пытаюсь создать скрипт, который поможет взломать шифры замещения или, возможно, транспонирования.

Код до сих пор:

cipher = open('cipher.txt','U').read()
cipherfilter = cipher.lower()
cipherletters = list(cipherfilter)

alpha = list('abcdefghijklmnopqrstuvwxyz')
occurrences = {} 
for letter in alpha:
    occurrences[letter] = cipherfilter.count(letter)
for letter in occurrences:
    print letter, occurrences[letter]

Все, что он делает, покажет, сколько раз появляется письмо. Как мне распечатать частоту всех букв, найденных в этом файле.

bernie · Answer 1 · 14 июня 2009

import collections

d = collections.defaultdict(int)
for c in 'test':
    d[c] += 1

print d # defaultdict(<type 'int'>, {'s': 1, 'e': 1, 't': 2})

Из файла:

myfile = open('test.txt')
for line in myfile:
    line = line.rstrip('\n')
    for c in line:
        d[c] += 1

Для гения, являющегося контейнером defaultdict , мы должны благодарить и хвалить. В противном случае мы все будем делать что-то глупое, как это:

s = "andnowforsomethingcompletelydifferent"
d = {}
for letter in s:
    if letter not in d:
        d[letter] = 1
    else:
        d[letter] += 1

Veedrac · Answer 2 · 13 сентября 2014

Современный способ:

from collections import Counter

string = "ihavesometextbutidontmindsharing"
Counter(string)
#>>> Counter({'i': 4, 't': 4, 'e': 3, 'n': 3, 's': 2, 'h': 2, 'm': 2, 'o': 2, 'a': 2, 'd': 2, 'x': 1, 'r': 1, 'u': 1, 'b': 1, 'v': 1, 'g': 1})

jacob · Answer 3 · 14 июня 2009

Если вы хотите узнать относительную частоту буквы c, вам придется разделить число вхождений c на длину ввода.

Например, взяв пример Адама:

s = "andnowforsomethingcompletelydifferent"
n = len(s) # n = 37

и сохранение абсолютной частоты каждой буквы в

dict[letter]

мы получаем относительные частоты:

from string import ascii_lowercase # this is "a...z"
for c in ascii_lowercase:
    print c, dict[c]/float(n)

сложив все это вместе, мы получим что-то вроде этого:

# get input
s = "andnowforsomethingcompletelydifferent"
n = len(s) # n = 37

# get absolute frequencies of letters
import collections
dict = collections.defaultdict(int)
for c in s:
    dict[c] += 1

# print relative frequencies
from string import ascii_lowercase # this is "a...z"
for c in ascii_lowercase:
    print c, dict[c]/float(n)

Определение частоты букв текста шифра

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Определение частоты букв текста шифра

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов