Question

Я пишу сценарий для прогнозирования текста, используя условное распределение частот NLTK.

Я хочу сохранить дистрибутив в базе данных SQL для последующего использования с использованием JSON. Это вообще возможно? Если да, как вывести дамп формата ConditionalFrequencyDistribution с использованием JSON?

Или, может быть, есть какой-то другой изящный способ его хранения?

cfd = ConditionalFreqDist()
prev_words = None
cnt=0  
for word in words:
    if cnt > 1:
        prev_words = words[cnt-2]+' '+words[cnt-1]
        cfd[prev_words].inc(word)
    cnt+=1

shenshei · Answer 1 · 05 февраля 2012

вы можете использовать pickle для хранения объекта ConditionalFreqDist () в файле

f = open('file.pkl', 'w')
pickle.dump(cfd, f)
f.close()

и вернуть объект

#load the object
f = open('file.pkl', 'r')
cfd = pickle.load(f)
f.close()

Сохранение условного частотного распределения с использованием NLTK

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Сохранение условного частотного распределения с использованием NLTK

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов