Выберите конкретные объекты, которые будут помечены - PullRequest
0 голосов
/ 13 июня 2019

Возможно ли, чтобы NER помечал подмножество только для сущностей.Например, мне могут понадобиться только сущности даты и денег, как я могу это сделать?

Я просматривал документацию EntityRecognized, но не видел ничего вокруг удаления сущностей.

1 Ответ

0 голосов
/ 15 июня 2019

Похоже, что этого можно достичь путем переподготовки тэгера NER. (Если вам интересен этот маршрут, прочитайте эту статью , в которой обсуждается ваша проблема.)

Но вы абсолютно уверены, что это необходимо?

Например, вы можете создать метод, который фильтрует результаты так, чтобы он возвращал только те типы сущностей, которые вы ищете.

def get_entities(doc):
    for entity in doc.ents:
        if entity.label_ in ["DATE","MONEY"]:
            yield entity
        else:
            continue

Затем, вместо итерации по doc.ents, вы можете итерировать по get_entities(doc).

Мне кажется, это более легкий путь.

...