Python NLTK неожиданная потеря данных за цикл данных - PullRequest
0 голосов
/ 01 марта 2019

Не самый любимый Python здесь, но должен использовать его для NLTK.Вот почему я подозреваю, что мне не хватает чего-то простого.

У меня есть корпус, который состоит из статей, которые состоят из предложений.У меня также есть следующая функция:

unlabelled = [] #first word of a sentence
labelled = [] #all words of a sentence except the first
for article in corpora:
    for sent in article:
        print(list(sent)) #returns everything as it should be
        for i, w in enumerate(sent):
            if (i == 0): 
            unlabelled.append((w.lower(), w))
        else:
            labelled.append((w.lower(), w))
        print(list(sent)) #returns everything as it should be

for article in corpora:
    print(list(article)) #returns all empty

Это ничего не должно делать с данными корпусов, просто собирать слова из них в два списка.В пределах циклов печать данных корпусов показывает, что все в порядке, ничего не изменилось.Однако печать сразу после цикла показывает, что корпус внезапно пуст, все статьи являются пустыми массивами, а предложения больше не существуют.

Что здесь происходит и почему?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...