Я пытаюсь разобрать описания YouTube песен для компиляции в .csv
В настоящее время я могу изолировать временные коды, хотя попытка изолировать песню и исполнителя оказывается более хитрой.
Во-первых, я ловлю whitesapce
# catches whitespace
pattern = re.compile(r'\s+')
Во-вторых, временные коды (для упрощения работы со строкой)
# catches timecodes
pattern1 = re.compile(r'[\d\.-]+:[\d.-]+:[\d\.-]+')
, затем я добавляю и удаляю.
Затем я пытаюсь перехватить все строки между \ n, так как форматируется треклист
songBeforeDash = re.search(r'^([\\n][a-zA-Z0-9]*-[a-zA-Z0-9]*[\\n]*)+$', description)
Формат соответствует \ n [строка] - [строка] \ n
Используя этот превосходный визуализатор , я смог настроить его так, чтобы он ловил первый результат, однако любые последующие результаты не совпадают. Является ли это случаем остановки при первом результате, а не поимки других?
Вот пример того, что я пытаюсь поймать
\nmiddleschoolxAso-Cypress\nShopan-Woodnot\nchromonicci-Memories.\nYasper-MoveTogether\nFenickxDelayde-Longwayhome\nauv-Rockaway5pm\nsadtoi-Aires\nGMillsxKyleMcEvoy-Haze\nRuckP-CoffeeBreak\n