Извлечение сущности естественного языка - PullRequest
0 голосов
/ 22 апреля 2019

У меня есть текст, который требует пометить объекты.

Пример:

Дэвид специализируется на биполярном расстройстве и работает в учреждении Калифорнийского университета.

У меня есть таблица со всеми сущностями в одной таблице, которая называется сущности , и таблица содержит 1 миллион записей.

Конечно, я бы писал и сканировал каждую из них, чтобы найти сущности, но проблема была бы в производительности.

Каков наилучший подход для идентификации таких организаций, как биполярное расстройство и Калифорнийский университет, из списка таблиц.

 I expect the out put to be in format
 array("bipolar disorder","California");
...