Не самый любимый Python здесь, но должен использовать его для NLTK.Вот почему я подозреваю, что мне не хватает чего-то простого.
У меня есть корпус, который состоит из статей, которые состоят из предложений.У меня также есть следующая функция:
unlabelled = [] #first word of a sentence
labelled = [] #all words of a sentence except the first
for article in corpora:
for sent in article:
print(list(sent)) #returns everything as it should be
for i, w in enumerate(sent):
if (i == 0):
unlabelled.append((w.lower(), w))
else:
labelled.append((w.lower(), w))
print(list(sent)) #returns everything as it should be
for article in corpora:
print(list(article)) #returns all empty
Это ничего не должно делать с данными корпусов, просто собирать слова из них в два списка.В пределах циклов печать данных корпусов показывает, что все в порядке, ничего не изменилось.Однако печать сразу после цикла показывает, что корпус внезапно пуст, все статьи являются пустыми массивами, а предложения больше не существуют.
Что здесь происходит и почему?