Question

Отображение покрытия слов для каждого идентификатора файла в отдельной строке текстового корпуса "gutenberg" из nltk.corpus.

Пробуется путем деления общего количества символов в каждом файле на количество слов.
Пробуется путем деления общего количества символов в каждом файле с уникальным количеством слов.

from nltk.corpus import gutenberg
for fileid in gutenberg.fileids(): 
    print((len(gutenberg.raw(fileid))/len(gutenberg.words(fileid))), fileid)

from nltk.corpus import gutenberg
for fileid in gutenberg.fileids(): 
   print((len(gutenberg.raw(fileid))/len(set(gutenberg.words(fileid)))), fileid)

Пожалуйста, примите к сведению ----
1. Это задача, которую я пытаюсь выполнить
2. Ожидаемый результат мне неизвестен
3. Если вывод правильный - он позволит перейти к следующим шагам вызова
4. Запустив приведенный выше код - я не получил ни одной ошибки, но в любом случае требуемый вывод не приходит, и он не позволяет мне выполнить задачу.

Как найти «Покрытие Word» для всех файлов, связанных с определенным текстовым корпусом

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как найти «Покрытие Word» для всех файлов, связанных с определенным текстовым корпусом

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов