Регулярное выражение - разделить на период (кроме St.) - PullRequest
0 голосов
/ 18 января 2019

Я читаю строки, одну за другой в Python. Я должен разделить строки, если они содержат конец предложения. Я использую функциональность re.split:

words= re.split(r'[.!?]', line)

Это хорошо работает, за исключением случаев, когда я сталкиваюсь с аббревиатурами, такими как 'St.'. Есть ли способ разделить на "!" но игнорировать, когда он используется как «Св.»?

1 Ответ

0 голосов
/ 18 января 2019

Вы можете попробовать использовать негативный взгляд:

words = re.split(r'(?<!St)[.!?]', line)

Демо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...