Проблемы с очисткой текста - PullRequest
0 голосов
/ 21 ноября 2018

Я изучаю очистку текста с помощью Python онлайн.Я избавился от некоторых стоп-слов и опустил букву.

, но когда я выполняю этот код, он ничего не показывает.

Я не знаю почему.

# we add some words to the stop word list
texts, article = [], []
for w in doc:
    # if it's not a stop word or punctuation mark, add it to our article!
    if w.text != '\n' and not w.is_stop and not w.is_punct and not w.like_num and w.text != 'I':
        # we add the lematized version of the word
        article.append(w.lemma_)
    # if it's a new line, it means we're onto our next document
    if w.text == '\n':
        texts.append(article)
        article = []

когда я пытаюсь вывести текст, он просто пуст.

1 Ответ

0 голосов
/ 03 декабря 2018

Я считаю, что списки «тексты» и «статьи» относятся к одному и тому же содержимому, и, следовательно, очистка содержимого одного списка также очищает другой список.

Вот ссылка на аналогичный вопрос: Python: добавление списка в другой список и очистка первого списка

Пожалуйста, посмотрите, насколько это полезно.

...