Подберите дефис в сочетании с символом новой строки - PullRequest
0 голосов
/ 28 мая 2018
import re
string = re.sub(r'-\n', '', string)

Я хочу токенизировать слова текста.Проблема состоит в том, что все слова, которые находятся в конце строки, являются неправильными.Поэтому я должен удалить дефис перед символом новой строки.

Спасибо за вашу помощь!

1 Ответ

0 голосов
/ 28 мая 2018

Попробуйте использовать предвидение для определения новой строки, а не включать его в часть подоперации:

string = re.sub(r'-(?=\n)', '', string)

Демо

...