Я хотел бы извлечь сущности для лечения наркомании, например, из этого предложения
The patient X took Vidaza 2.5 mg daily for the last 6 months.
В результате мне нужно получить сущность «Наркотик» со следующими атрибутами:
Name: Vidaza
Lemma: Azacitidine
Dose: 2.5
Measure: mg
Freq: daily
Вопросы:
- Можно ли создать такой аннотатор / модель с spark-nlp или другими библиотеками NLP (особенно Apache Spark friendly)?
- Если да - как я могу это сделать? Какие-нибудь URL-адреса для документов?
Я создал такие аннотаторы для Apache UIMA, и мне интересно, возможно ли сделать то же самое с помощью других библиотек NLP.