Сохранение условного частотного распределения с использованием NLTK - PullRequest
0 голосов
/ 05 февраля 2012

Я пишу сценарий для прогнозирования текста, используя условное распределение частот NLTK.

Я хочу сохранить дистрибутив в базе данных SQL для последующего использования с использованием JSON. Это вообще возможно? Если да, как вывести дамп формата ConditionalFrequencyDistribution с использованием JSON?

Или, может быть, есть какой-то другой изящный способ его хранения?

cfd = ConditionalFreqDist()
prev_words = None
cnt=0  
for word in words:
    if cnt > 1:
        prev_words = words[cnt-2]+' '+words[cnt-1]
        cfd[prev_words].inc(word)
    cnt+=1

1 Ответ

1 голос
/ 05 февраля 2012

вы можете использовать pickle для хранения объекта ConditionalFreqDist () в файле

f = open('file.pkl', 'w')
pickle.dump(cfd, f)
f.close()

и вернуть объект

#load the object
f = open('file.pkl', 'r')
cfd = pickle.load(f)
f.close()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...