как сопоставить предложение, содержащее определенное слово в разных шаблонах - PullRequest
0 голосов
/ 02 мая 2018

У нас здесь проблема ... У нас есть текст, имеющий разные образцы предложений. Мы хотим получить предложение, содержащее определенное слово.
Например:

Еще один момент, путем предоставления другой модели. Анализ в Второй абзац может привести в следующем направлении. «The Разрушители 'имеют дело, очевидно, с разрушением, в то время как книга Бытие имеет дело с творением. Словарь похож на: Блэки замечает, что «хаос наступил», ироническое изменение Бога наложение формы на пустоту. Кроме того, фраза «полосы света пришел через закрытые ставни, где они работали с Серьезность создателей, использованная в контексте разрушения, также пародирует создание света и тьмы в ранних отрывках Библейская книга. Ироническое использование Грин лексики Библии может быть, что для него Вторая мировая война сигнализировал конец определенной христианской эры. Теперь это прекрасно Можно утверждать, что рост фашизма связан с этим, или что это причина. Культ личности и светского руководства, для Грина, перенял с ключевой роли церкви в западных обществах. В Таким образом, две основные темы, указанные выше - напряженность между индивид и сообщество, и религия - связаны между собой. С точки зрения эссе написание этой ссылки вполне может быть сделано после обсуждения темы личности и сообщества, и его связи с темой руководство. Это может быть общий вывод к эссе. После вдумчивое рассмотрение и интерпретация студент может решить что это то, к чему сводится (деструкторы.) ': Грин делает четкая связь между ростом фашизма и падением церкви влияние. Несмотря на то, что фашизм был недавно побежден, Грин видит отсутствие каких-либо современных ценностей, которые могли бы обеспечить социальная сплоченность как обеспечивающая возможность ее появления.

В приведенном выше тексте у нас есть жирные слова (деструкторы). Мы хотим получить предложения, имеющие слово «деструкторы».
Слово «деструкторы» может присутствовать в разных форматах. Например: (destructors), (DesTrucTors), (Des.tructors), DESTRUCTORS, destructors, des-tructors.
Когда мы пытались написать регулярное выражение для сопоставления предложений, мы не смогли получить предложения при некоторых условиях (например, мы получаем половину предложений и т. Д.).

Не могли бы вы помочь нам с этим.
Если эта информация не поможет вам решить, пожалуйста, сообщите нам. Буду обновлять его.
Спасибо ...

Ответы [ 2 ]

0 голосов
/ 02 мая 2018

Я не слишком уверен насчет Python, но я верю, что это может сработать:

for match in re.finditer(r"[^.]*destructors[^.]*\.[^\w\s]*", subject, re.IGNORECASE):
# match start: match.start()
# match end (exclusive): match.end()
# matched text: match.group()

В любом случае, я думаю, что вы хотите регулярное выражение:

[^.]*destructors[^.]*\.[^\w\s]*

с учетом регистра без учета регистра и с глобальными флагами.

0 голосов
/ 02 мая 2018

Будет полезно, если вы предоставите шаблон регулярных выражений, который вы уже использовали. Лучшее, что я могу придумать, это,

str_text='your text here containing DESTRUCTORS'
match=re.search('pass all the destructors combination here', str_text, flags=re.IGNORECASE)

Попробуйте больше шаблонов, доступных для форматирования строк с регулярным выражением здесь, https://docs.python.org/3/library/re.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...