Извлечение определений и текста, соответствующего определению - PullRequest
1 голос
/ 27 марта 2019

Я пытаюсь извлечь определения и текст, соответствующий этому определению.

Извлечение определений относительно просто, потому что они обычно заключаются в скобки и в кавычки, поэтому я могу запустить Регулярное выражение, чтобы найти их.

Часть, с которой у меня возникают проблемы, - это получение текста, соответствующего определению - обычно он появляется перед определением, но я не знаю, сколько слов будет частью этого.

Например:

"(a) Компания обладает необходимыми корпоративными полномочиями и полномочиями для исполнения и предоставления настоящего Соглашения, выполнения своих обязательств по настоящему Соглашению и, при условии получения Реквизита Компании, для завершения Сделок. Исполнение, поставка и исполнение Компанией настоящего Соглашения, и совершение Компанией Операций было должным образом санкционировано Правлением Компании, и никакие другие корпоративные действия со стороны Компании не требуются для санкционирования исполнения и доставки Компанией настоящего Соглашения, План слияния и совершение им сделок, в каждом случае, подлежат только утверждению и утверждению настоящего Соглашения, плана слияния и сделок посредством (i) специального решения акционеров утвердительным голосованием Владельцы Акций, представляющие как минимум две трети голосующих акций Акций, присутствующих и голосующих лично или по доверенности в качестве единого класса на Собрании Акционеров, (ii) решение акционеров утвердительным голосованием держателей Акций, представляющих большинство совокупного права голоса находящихся в обращении Акций Компании, и (iii) решение акционеров утвердительным голосованием держателей большинства акций в обращении класса А Акции (в совокупности пункты (i), (ii) и (iii) «Необходимое голосование компании»), в каждом случае, в соответствии с Разделом 233 (6) CICL и Девятым Уставом с поправками и изменениями Устава Компания, принятая специальным решением от 28 декабря 2015 г. («Устав Компании»). Настоящее Соглашение было должным образом и надлежащим образом исполнено и доставлено Компанией и, при условии надлежащего разрешения, исполнения и доставки со стороны Parent and Merger Sub, представляет собой юридическое, действительное и обязывающее обязательство Компании, которое может быть применено к Компании в соответствии с ее условиями. при условии банкротства, несостоятельности, мошеннического перевода, реорганизации, моратория и аналогичных законов общего применения, касающихся или затрагивающих права кредиторов и общие принципы справедливости («Исключение в отношении банкротства и справедливости»). "

имеет три определения, которые мы извлекаем: « Необходимое голосование компании », « Устав компании » и « Исключение банкротства и справедливости ».

" Необходимое голосование компании " выглядит так, как будто определение должно быть "коллективно оговорками (i), (ii) и (iii)", но на самом деле следует также добавить "подраздела (a)" или I должен фактически взять текст пунктов (i), (ii) и (iii)

" Устав компании" выглядит так, как и должно быть "Девятый Устав Компании с изменениями и дополнениями, принятый специальным постановлением от 28 декабря 2015 г."

" Исключение банкротства и справедливости " выглядит так, как будто это должно быть "банкротство, несостоятельность, мошенническая передача, реорганизация, мораторий и аналогичные законы общего применения, касающиеся или затрагивающие права кредиторов и общие принципы справедливости «

Это всего лишь три примера, и мне нужно построить что-то достаточно динамичное, чтобы иметь возможность обрабатывать различные типы определений.

Я начал с сборкиВ фразе существительного используются NLTK и грамматика, но NP, кажется, не собирают все, что мне нужно, даже при тестировании различных грамматик. Я подумал об использовании редактирования измерений расстояния - возможно, построив строку перед словом за словом и протестировав расстояние, но все вещи, о которых я могу подумать, имеют свои недостатки, поэтому я ищу идеи.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...