У меня есть сценарий фильма. Моя первая работа - собирать строки каждого символа в словаре.
Позже мне нужно будет поместить данные в серию.
Прямо сейчас у меня все диалоги в списке,начиная с имен персонажей. Он имеет следующий формат:
Диалог [0] 'NAME1 \ n (16 пробелов) YO, YO, хорошо, что вы здесь, человек.'
Все имена заканчиваются на \п. И тогда все строки диалога начинаются с 16 пробелов. Я думаю, что это может быть полезно, но я не уверен, как это использовать.
Я пробовал несколько вещей, но почти не повезло.
result = {}
for lines in dialogue:
first_token = para.split()[0]
if first_token.endswith('\n'): #this would be the name
name, line = para.split(on the new line?)
name = name.strip()
if name not in result:
result[name] = []
result[name].append(line)
return result
Этот код дает мнекуча ошибок, так что я не думаю, что было бы полезно перечислять их здесь.
В идеале мне нужно, чтобы каждый символ был первым ключом в словаре, а затем все их строки в качестве данных.
Примерно так:
Имя1: [Строка1, Строка2, Строка3 ...] Имя2: [Строка1, Строка2, Строка3 ...]
РЕДАКТИРОВАТЬ: Некоторые из имен символов имеют дваслова
РЕДАКТИРОВАТЬ 2: Возможно, было бы проще вернуться к исходному текстовому файлу сценария фильма.
Он отформатирован следующим образом:
NAME1
Yo, Yo, good that you're here
man.
NAME2
(Laughing)
I don't think that's good! We were
at the club, smoking, laughing -- doing
stuff.