Я использую GATE для обработки текстов, написанных на естественном языке.Я должен извлечь из текста рост, вес, bp и т. Д. И сохранить его в структурированном виде.Теперь, эти вещи (то есть рост, вес и т. Д.) Могут быть записаны во многих формах, что мне неизвестно.Написание грамматики JAPE для всех различных способов, которые я могу придумать, просто жестко ее кодирует.Есть ли у меня какой-либо другой вариант обработки документов более гибким способом?
Кроме того, меня смущает вопрос о том, могу ли я использовать ANTLR для генерации грамматики jape, представляя различные способы записи высоты, веса и т. Д.?
Текст будет содержать следующее:
Vitals: Height: 72 inches, Weight is 170 pounds, T is 89.9 degree Fahrenheit. OR
Vitals: He is 184 cm tall, his weight was 67.8 Kg, RR 16 (its respiration rate). OR
Vitals: height is 6ft 3 in, he weighs 70 kg, pulse is 67, Temperature 99.8 degrees.
Теперь я использую грамматику JAPE и ANNIE для токенизации текста, чтобы извлечь эти жизненно важные органы и сохранить в структурированной форме.Будет ли использование ANTLR гибким для маркировки такого текста?Гибкость в том смысле, что я не должен жестко кодировать его для каждого способа представления, поскольку вы видите, что рост, вес и т. Д. Могут быть представлены во многих формах.
Будет ли это хорошей идеей для поиска или разработки какого-либоГенератор грамматики, который будет генерировать грамматики jape?
Если вам требуется какая-либо деталь, чтобы лучше понять проблему, пожалуйста, дайте мне знать.
Спасибо большое !!