Я тестирую модель ML, и мне нужно объединить текст, чтобы вырезать аудиофайл и обучить модель. Как я могу объединить текст, используя условия?
Моя цель - объединить текст в столбце «Текст», пока я не достигну конечной пунктуации, чтобы сформировать предложение. Я хочу продолжать формировать предложения, пока не достигну конца текстового файла.
Я пытался использовать группы панд.
df.groupby(['Name','Speaker','StTime','EnTime'])['Text'].apply(' '.join).reset_index()
Example:
Name Speaker StTime Text EnTime
s1 tom 6.8 I would say 7.3
s1 tom 7.3 7.6
s1 tom 7.6 leap frog 8.3
s1 tom 8.3 9.2
s1 tom 9.2 a pig. 10.1
Name Speaker StTime Text EnTime
s1 tom 6.8 I would say leap frog a pig. 10.1