Похоже, что этого можно достичь путем переподготовки тэгера NER. (Если вам интересен этот маршрут, прочитайте эту статью , в которой обсуждается ваша проблема.)
Но вы абсолютно уверены, что это необходимо?
Например, вы можете создать метод, который фильтрует результаты так, чтобы он возвращал только те типы сущностей, которые вы ищете.
def get_entities(doc):
for entity in doc.ents:
if entity.label_ in ["DATE","MONEY"]:
yield entity
else:
continue
Затем, вместо итерации по doc.ents
, вы можете итерировать по get_entities(doc)
.
Мне кажется, это более легкий путь.