Получить только текст с регулярным выражением Python - PullRequest
1 голос
/ 17 октября 2019

Как я могу получить

Президент Соединенных Штатов назначает членов кабинета,
назначения подлежат утверждению Сенатом.

от

1. The president of the United States
appoints the cabinet members,

appointments are subject to Senate
approval.

(A) their

(B) with their
(C) because their
(D) but their

Я начинаю свой паттерн, но он останавливается на слове «Штаты». Также я пытаюсь поставить первую скобку (A) как конец строки, но все еще не работает

import re

regex = r'\d{1,}\.\s(\w.+)'

1 Ответ

3 голосов
/ 17 октября 2019

Вы можете использовать это регулярное выражение в python:

r'(?s)\A\d+\.\s+(.+?)(?=\n\()'

Демонстрация RegEx

Вот подробности регулярного выражения:

  • (?s): Включить однострочный режим в регулярном выражении
  • \A: начало ввода
  • \d+: сопоставить 1+ цифр
  • \.: сопоставить .
  • \s+: совпадение с 1+ пробелами
  • (.+?): наш сопоставленный текст, который будет иметь 1+ любых символов, включая разрывы строк, захвачен в группе # 1
  • (?=\n\(): заблаговременно, чтобы убедиться, что в матче есть разрыв строки и ( впереди
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...