Автоматическое извлечение сущностей NLP - PullRequest
0 голосов
/ 26 мая 2020

Я обучил модель с использованием автоматической обработки естественного языка - извлечения сущностей. На данный момент я обучил эту модель извлекать одно ключевое слово под каждой сущностью из текста, однако я хочу пометить одно ключевое слово под двумя сущностями, чтобы создать иерархию. Пример. На данный момент ключевое слово «Lazada» помечено как «Lazada_Ecommerce», однако я хочу пометить это ключевое слово под двумя сущностями - под-сущностью «Lazada» и основной сущностью «Ecommerce». Было бы здорово, если бы кто-нибудь предложил, возможно ли это с моделью Google Auto NLP-Entity Extraction и как.

Спасибо, Сати sh Kumar Data Scientist

1 Ответ

0 голосов
/ 27 мая 2020

Google NLP Entity Extraction не поддерживает иерархии сущностей. Результат прогноза включает в себя массив объектов, соответствующих каждой обнаруженной сущности в тексте.

https://cloud.google.com/automl/docs/reference/rpc/google.cloud.automl.v1#google .cloud.automl.v1.PredictResponse

включает свойство 'payload', которое представляет собой массив:

https://cloud.google.com/automl/docs/reference/rpc/google.cloud.automl.v1#google .cloud.automl.v1.AnnotationPayload

Примечание. Если «подобъект» может только иметь одну «главную сущность», тогда вы можете управлять иерархиями сущностей, внешними по отношению к модели, то есть обучать модель предсказывать «Lazada» и другие суб-сущности и извне определять, что «Lazada» и другие принадлежат основной «электронной торговле» категория. Однако, если ваша модель сущности может иметь сущность «Lazada» под несколькими основными сущностями, тогда будет подходящим ваше текущее решение (например, «Lazada_Ecommerce», «Lazada_SomeOtherMainEntity» и др. c.).

.
...