У меня большой текст. Я хотел бы найти адрес владельца. Мой вклад похож на ...
INPUT: (...) seiscientos catorce guión ocho, domiciliado en calle
Santillana número trescientos sesenta y nueve, Valle Lo Campino,
Comuna de Quilicura, Región Metropolitana, учредительный офис
por acciones (...)
keywords_cap = ['DOMICILIO:', 'Domicilio:', 'Domicilio', 'DOMICILIO', 'domiciliado en', 'domiciliada en',
'Domiciliado en', 'Domiciliada en']
keywords_cap = map(re.escape, keywords_cap)
keywords_cap.sort(key=len, reverse=True)
obj = re.compile(r'\b(?:{})\s*(.*?)\.'.format('|'.join(keywords_cap)))
obj2 = obj.search(mensaje)
if obj2:
company_name = obj2.group(1)
else:
company_name = "None"
РЕЗУЛЬТАТ: calle Santillana número trescientos sesenta y nueve
Что-то не так, потому что я хотел бы выделить текст между одним словом ключевых слов и следующей запятой (,) или следующей точкой (.).
Но извлечение ведется с этого списка ключевых слов только до следующей точки (.).
Может ли кто-нибудь помочь мне с этой глупостью?