N грамм НЛП в файл Excel - PullRequest
       9

N грамм НЛП в файл Excel

0 голосов
/ 08 декабря 2018

Я борюсь с этим фрагментом кода.Мне нужно создать 1 и 2 граммовую модель и сопоставить граммы с их частотой;После того, как мне нужно записать 2 модели в один файл EXCEL на двух разных листах ... Я прихожу сюда, показывая грамм и частоту 2 моделей, но пытаюсь понять, как добавить результат и создать файл Excel.

import nltk
nltk.download('punkt')
f = open('data.json','r')
raw = f.read()

tokens = nltk.word_tokenize(raw)

#Create your bigrams
bgs = nltk.bigrams(tokens)

#compute frequency distribution for all the bigrams in the text
fdist = nltk.FreqDist(bgs)
for k,v in fdist.items():
print (k,v)

Спасибо

1 Ответ

0 голосов
/ 08 декабря 2018

Этот код экспортирует распределение частот в CSV-файл.:

import csv
import nltk
nltk.download('punkt')
f = open('data.json','r')
raw = f.read()
tokens = nltk.word_tokenize(raw)

#Create your bigrams
bgs = nltk.bigrams(tokens)

#compute frequency distribution for all the bigrams in the text
fdist = nltk.FreqDist(bgs)
with open("fdist.csv", "w") as fp:
    writer = csv.writer(fp, quoting=csv.QUOTE_ALL)
    writer.writerows(fdist.items())
...