Я пытаюсь выяснить, каким образом (и какой из них лучший) извлечения значений для предопределенных ключей в неструктурированном тексте?
* +1002 * Введите:
- Доктор прописал мне препарат под названием фавипиравир.
- Его зовут Юрий.
- Илья уже рассказал мне об этом.
- Сегодня холодная погода.
- Я принимаю лекарство под названием називин.
Список ключей: ['наркотик', 'имя', 'погода']
Выход:
['drug = favipiravir', 'drug = nazivin', 'name = Yury', 'weather = cold']
Итак, как вы можете видеть, в 3-м предложении нет явного ключа 'name' и, следовательно, никакого извлеченного значения (я думаю, что есть разница с NER). В то же время, «лекарство» и «лекарство» являются синонимами, и мы должны рассматривать «лекарство» как ключ «лекарство» и также извлекать значение.
И следующий вопрос, что если набор ключей будет изменяемым?
Должен ли я использовать в качестве базового подхода регулярных выражений из-за предопределенных ключей или есть способ реализовать его с помощью контролируемого обучения / NN? (но как в этом случае обращаться с изменяемыми ключами?)