Просто используйте несколько текстовых клипов и объедините их в CompositeVideoClip , выполнив что-то вроде
import moviepy.editor as mp
text_1 = mp.TextClip("text1", color='white', align='West', fontsize=40, font='Arial', method='label').set_position(("center", "top"))
text_2 = mp.TextClip("text2", color='white', align='West', fontsize=40, font='Arial', method='label').set_position(("center", "bottom"))
full_text = mp.CompositeVideoClip([text_1, text_2])