У меня есть несколько тысяч отчетов, в которых последовательно отформатированы табличные данные, которые мне нужно извлечь.
У меня есть несколько идей, но я решил опубликовать, чтобы увидеть, есть ли лучший способ сделать это, чемо чем я думаю;которая заключается в извлечении табличных данных, создании нового файла для них, а затем в синтаксическом анализе этих данных в виде табличного файла.
Вот пример ввода и вывода, где вывод читается и записывается строка за строкой в базу данных.
INPUT_FILE
MiscText MiscText MiscText
MiscText MiscText MiscText
MiscText MiscText MiscText
SubHeader
PASS 1283019238 alksdjalskdjl
FAIL 102310928301 kajdlkajsldkaj
PASS 102930192830 aoisdajsdoiaj
PASS 192830192301 jiasdojoasi
MiscText MiscText MiscText
MiscText MiscText MiscText
MiscText MiscText MiscText
ВЫХОД (чтение / запись построчно из текстового файла в БД)
ROW-01{column01,column02,column03}
...
ROW-nth{column01,column02,column03}