Я пишу сценарий для прогнозирования текста, используя условное распределение частот NLTK.
Я хочу сохранить дистрибутив в базе данных SQL для последующего использования с использованием JSON. Это вообще возможно? Если да, как вывести дамп формата ConditionalFrequencyDistribution с использованием JSON?
Или, может быть, есть какой-то другой изящный способ его хранения?
cfd = ConditionalFreqDist()
prev_words = None
cnt=0
for word in words:
if cnt > 1:
prev_words = words[cnt-2]+' '+words[cnt-1]
cfd[prev_words].inc(word)
cnt+=1