Разбор текста на основе пробелов с использованием Python - PullRequest
0 голосов
/ 24 апреля 2018
            No time. Not today.
                (slides in last bullets)
            Ten, eleven, twelve... or bust.
                (chambers a shell into each
                 gun, looks up)
            Right here!

The cab SCREECHES to a stop on the shoulder of the highest
FREEWAY in a massive INTERCHANGE of freeways. Dopinder halts
the meter and hands Deadpool his CARD.

Моя цель - проанализировать текст выше, чтобы диалог был отделен от описания.Есть несколько случаев этого в моем файле.Выходными данными должны быть две отдельные строки x и y, где:

x = "No time. Not Today...Right Here!"

и

y = "The cab SCREECHES...his CARD"

Как этого добиться с помощью сопоставления регулярных выражений?Или есть лучший способ решить это?Я использую Python.

1 Ответ

0 голосов
/ 24 апреля 2018

Кажется, что два последовательных переноса строк являются разделителями разделов текста, поэтому вы можете разделить его:

x, y = s.split('\n\n')

Вы также можете узнать, является ли переменная диалоговой или нет, проверив еепервые персонажиЕсли они являются пробелами (то есть с отступом), то это диалог:

x.startswith('            ') # True if dialog, False otherwise

Если вам нужно удалить лишние пробелы до и после каждой строки, используйте strip:

x, y = [x.strip() for x in s.split('\n\n')]

Поступая таким образом, вы не сможете проверить, является ли что-то диалоговым, поэтому не забудьте проверить это перед удалением пробелов.

...