За последнюю неделю я пытался решить эту проблему, не добившись никакого прогресса. Любая помощь от вас очень ценится.
У меня есть тысячи файлов со следующим текстом:
,,,,,,,,,,,,,,,,
,,,,,,,,,,,,,,,,
Location:,,,ADDRESS_HERE_THAT I WANT
BUT IT CAN ALSO BE ACROSS,
MULTIPLE LINES, BUT NOT A SPECIFIC SET OF LINES,
AND IT ENDS AS ABRUPTLY,,,,,,,,,,,,,
,,,,,,,,,,,,,,,,
Но у некоторых файлов также есть такой способ
,,,,,,,,,,,,,,,,
Location:,,,ADDRESS,IS,IN,ONE,LINE,,,,,,,,,,,,,
,,,,,,,,,,,,,,,,
Мне нужно извлечь заглавный адрес с помощью регулярных выражений в Python.
Технически это файл CSV, который был экспортирован очень старой системой. Он фактически непригоден для использования в качестве CSV, и поэтому я решил извлечь строку, предполагая, что это простой текстовый файл.
Мой текущий код такой, но я пробовал довольно много других комбинаций, не прибывая в рабочем решении.
location = re.findall(r'^Location:,,,(.*),,,,,,,,,,,,,\n$|^Location:,,,(.*)[\n.*]{1,2,3,4,5,6},,,,,,,,,,,,,', CSV, flags=re.DOTALL | re.MULTILINE)
Я даже близко? Или есть лучший способ решить эту проблему?
Я благодарен за любую помощь здесь.