Я пытаюсь написать анализатор сведений о компании, который может разбить текст, как показано ниже, на составляющие:
ФИРМА ЗЕМЕЛЬНЫХ И СОВМЕСТНЫХ СИСТЕМ
Управление общей подписью
Wookey Hole Road
Колодцы
Сомерсет
BA5 1AA
Тел: +44 (0) 1749 682384
Факс: +44 (0) 1749 682235
Проблема, с которой я сталкиваюсь, состоит в том, как я могу сказать, что «Total Signature Management» на самом деле не является частью адреса? Как правило, компания отображает свое имя «THALES LAND AND JOINT SYSTEM», и строка 2 обычно будет первой частью адреса.
В случае, указанном выше, за названием компании следует неадресная часть, есть ли какая-либо разница?
Спасибо