Анализ тональности определенного абзаца на сайте - PullRequest
0 голосов
/ 29 мая 2020

У меня есть URL-адреса нескольких веб-сайтов в файле xlsx. Я запустил al oop в файле xlsx и передал URL-адреса в качестве аргумента в следующий код анализа тональности. Теперь код предоставляет мне анализ всего веб-сайта (веб-сайты содержат только текст и числа), но проблема в том, что я хочу выполнить анализ только для абзаца, который начинается с «Управленческая функция». Как я могу сделать то же самое? Вот мой код:

article = Article(j)
article.download()
article.parse()
#nltk.download('punkt')
article.nlp()
text = article.summary
obj = TextBlob(text)
sentiment = obj.sentiment.polarity
print(round(sentiment,2))
if sentiment==0:
    print("neutral")
elif sentiment>0:
    print("positive")
elif sentiment<0:
    print("negative")

1 Ответ

0 голосов
/ 29 мая 2020

Используя regex, что-то вроде следующего будет соответствовать абзацу, начинающемуся с «Управленческая функция»:

found=re.search(r'^(Managerial function.*\s)', full_text, re.MULTILINE)
my_paragraph=found.group(0)

, где full_text - это весь текст вашей статьи.

Помните чтобы сначала добавить этот импорт:

import re
...