Я генерирую текст, используя это:
for i in xrange(100):
sys.stdout.write(alphabet[bisect.bisect(f_list, random.random()) - 1])
я получаю вывод, который выглядит так:
fnhtlr hhub del tn eleo s d nerowepeldhoantah yf tr e saetenwgkoyears
oenooe urbmhonnrniwc iasseb
и я хотел бы знать, как сохранить вывод как TEXT, а не список, чтобы я мог использовать для него fd.inc (word). Я в основном пытаюсь построить закон Ципфа с моим случайным выводом.
если я использую это:
text1 = [alphabet[bisect.bisect(f_list, random.random())] for i in xrange(300)]
мой вывод хранится в виде списка, и fd не работает с ним, так как он считает каждый символ отдельным словом.
for word in text1:
fd.inc(word)
print fd
<FreqDist: ' ': 1776, 'e': 1008, 'a': 752, 't': 750, 'n': 604, 'i': 586,
'o': 556, 'h': 542, 's': 528, 'r': 478, 'l': 388, 'd': 312, 'u': 242,
'm': 202, 'w': 192, 'g': 172, 'b': 152, 'p': 152, 'f': 150, 'c': 148, 'y': 120,
'k': 90, 'v': 66, 'q': 12, 'z': 10, 'x': 8, 'j': 4>
Мне бы хотелось, чтобы каждая последовательность букв, разделенных пробелом, рассматривалась как слово, т. Е. Чтобы вывод считался текстом.
Спасибо за вашу помощь!