Как лучше всего в этом случае хранить для каждого докладчика произносимый текст в форме диктовки или лучшего варианта? Я хочу сопоставить каждый произнесенный текст с каждым оратором, как эта попытка. Но результат не такой, как я ожидал.
def speaker_texts(cleanedList):
dictspeaker = {"Speaker": "", "Group": "", "Text": ""}
pattern_speaker = r"([A-Z]+[a-z]*)([\s]*)(\([A-Z]*\))"
for sent in cleanedList:
speaker = re.findall(pattern_speaker, sent)
for info in speaker:
dictspeaker.update({"Speaker":info[0], "Group":info[2], "Text": sent})
Выход:
{'Speaker': 'Rische', 'Group': '(KPD)', 'Text': ', Antragsteller: Meine Damen und \nHerren! Anläßlich der Regierungserklärung und \n\n\x0c\n\n30 \n\n(Rische) \nauch in der heutigen Debatte zum Flüchtlings-\nproblem wurden viele Worte über eine sinnvolle, \nden sozialen Belangen entsprechende Verwendung \nöffentlicher Mittel gesprochen. Di e Regierung gab \nin ihrem Programm zu verstehen, daß sie eine ver-\nantwortungsbewußte Sozialpolitik durchzuführen \ngedenke. Sie hat die Flüchtlingshilfe, den Woh-\nnungsbau, die Verbe.'}
В файле динамик выступает несколько раз. Я хотел бы назначить устные тексты соответствующему докладчику. То есть всякий раз, когда появляется говорящий, обновляйте его в словаре, чтобы новый текст добавлялся без перезаписи старого.
Или я должен создать для каждого Спикера собственный дикт?