Как вырезать первые символы, пока не найден специальный символ? - PullRequest
0 голосов
/ 27 мая 2018

У меня есть 100 строк, где каждая строка состоит из нескольких предложений. Каждая строка начинается с нескольких символов, за которыми следует -rrb-.

Как мне отформатировать текст, чтобы каждая строка фактически начиналась после -rrb-.

Пример строки:

Lorem ipsum -lrb- dolor -rrb- sit amet, consitteur adipiscing elit.Nam quis dolor a sapien efficitur fermentum egestas ut elit.Nulla porttitor diam id orci bibendum volutpat.Quisque imperdiet euismod neque in efficitur.

Я хочу для этой и каждой строки:

sit amet, concitteur adipiscing elit.Nam quis dolor a sapien efficitur fermentum egestas ut elit.Nulla porttitor diam id orci bibendum volutpat.Quisque imperdiet euismod neque in efficitur.

Итак, я хочу начать это и каждые 100 строк после слова -rrb- (в данном примере «сидеть»).

Ответы [ 3 ]

0 голосов
/ 27 мая 2018

просто индексировать его:

print(s[s.index('-rrb-')+6:])

Вывод:

sit amet, consectetur adipiscing elit. Nam quis dolor a sapien efficitur fermentum egestas ut elit. Nulla porttitor diam id orci bibendum volutpat. Quisque imperdiet euismod neque in efficitur.
0 голосов
/ 27 мая 2018

@ NavaW , вы можете попробовать следующий код, чтобы получить предложение после -rrb- для 1 строки.

Наконец, вы можете зациклить более 100 строк иобрабатывать каждую строку.

line = "Lorem ipsum -lrb- dolor -rrb- sit amet, consectetur adipiscing elit. Nam quis dolor a sapien efficitur fermentum egestas ut elit. Nulla porttitor diam id orci bibendum volutpat. Quisque imperdiet euismod neque in efficitur."
new_line = line.split("-rrb-")[1].strip()
print(new_line)

"""
sit amet, consectetur adipiscing elit. Nam quis dolor a sapien efficitur fermentum egestas ut elit. Nulla porttitor diam id orci bibendum volutpat. Quisque imperdiet euismod neque in efficitur.
"""
0 голосов
/ 27 мая 2018

Использовать сплит:

text = line.split('-rrb-', 1)[-1]
...