различать положительное и отрицательное предложение - PullRequest
0 голосов
/ 04 июля 2019

У меня есть ряд мнений врачей о пациентах, которые могут иметь или не иметь определенные отклонения.

Допустим, мнение доктора о пациенте А:

Пациент не показываетпризнак мс

или

Никаких очаговых или эпилептиформных признаков не отмечено

, а для пациента B составляет

у пациента проявляются признаки мс

или

сложных парциальных припадков

Я хочу классифицировать A как больного, но не B.

Возможно ли использовать NLTK lib?

Я пытался извлечь теги из предложения, используя следующий код, но не знаю, откуда это пошло!

text = 'No focal or epileptiform features were noted'
tokens = nltk.word_tokenize(text)
tagged = nltk.pos_tag(tokens)
print(tagged)

[('No', 'DT'), ('focal', 'JJ'), ('or', 'CC'), ('epileptiform', 'JJ'), ('features', 'NNS'), ('were', 'VBD'), ('noted', 'VBN')]

Ответы [ 2 ]

0 голосов
/ 07 июля 2019

Как подсказывает nag , вы можете либо создать систему на основе правил, основанную на ваших ключевых словах и фразах, указывающих на отрицание, либо вы можете попытаться обучить контролируемую статистическую модель для прогнозирования класса (положительного или отрицательного дляданной болезни).

Я также призываю вас быть предельно осторожными с тем, как вы используете полученную систему, поскольку неправильные прогнозы могут оказать огромное влияние на жизнь людей в медицинской сфере.

0 голосов
/ 07 июля 2019

Надеюсь, вы знакомы с ML.Используйте ту же технику, что и для обнаружения спама, и создайте набор ограничивающих слов.затем примените его к своим текстовым файлам и предложите метку для каждого как pos или neg.Вы можете взглянуть на это: https://towardsdatascience.com/spam-classifier-in-python-from-scratch-27a98ddd8e73

...