извлекать структурированные данные из текста - PullRequest
0 голосов
/ 06 марта 2020

Существует ли какой-либо инструмент / библиотека (желательно установленный / solid коммерческий продукт или открытый исходный код), который может извлекать структурированные данные из простого текста? Обычно простой текст содержит булевы или математические операнды, такие как (AND, OR, BETWEEN, et c.).

Мне нравится AWS Comprehend, но я не уверен, что его можно легко использовать для этой задачи ,

vehicle with 2 to 5 wheels
=>
SUBJECT: vehicle
EXPRESSION:
  SUBJECT: wheels
  OPERAND: BETWEEN
    NUMBER: 2
    NUMBER: 5

1 Ответ

0 голосов
/ 15 апреля 2020

Comprehend не поддерживает преобразование текста в структурированный формат. Однако вы можете извлечь части речи, используя синтаксический API, и создать оттуда структуру, основанную на правилах.

https://docs.aws.amazon.com/comprehend/latest/dg/how-syntax.html

Для приведенного выше примера «транспортное средство» «и» колеса будут обнаружены как существительные, «2» и «5» будут обнаружены как цифры / значение, а «до» и «с» обнаружены как сложение.

...