Я использовал библиотеку полиглотов для распознавания именованных объектов и сохранил результат в массиве.Теперь элементы этих двух массивов не совпадают с другими.
REL_LIST = np.array(['ریس جمهور', 'تولد', 'استاد', 'کارمند', 'ریس'])
SENT_LIST = np.array(['رئیس جمهور محمد اشرف غنی تاکید ورزیده که حکومت افغانستان نباید در گفتگو های صلح در حاشیه رانده شود.'])
FINAL_NER_LIST =[]
for sent in range(len(SENT_LIST)):
list = SENT_LIST[sent].entities
FINAL_NER_LIST.append(list)
for rel in range(len(REL_LIST)):
if REL_LIST[rel] in SENT_LIST:
FINAL_NER_LIST.extend(REL_LIST[rel])
Моя цель - проверить, есть ли какая-либо сущность REL_LIST
в SENT_LIST
и вывод NER полиглота, как показано ниже:
[[I-PER(['محمد', 'اشرف']) I-LOC(['افغانستان'])]
[I-LOC(['میونیخ', 'جرمنی']) I-PER(['عبدالعزیز'])]
[I-PER(['اشرف']) I-LOC(['کابل'])]
[I-PER(['اشرف', 'غنی']) I-LOC(['افغانستان'])]]