У меня есть файл PDF, в котором есть список заданий определенного экзамена.
Меня особенно интересует первый список, но, к сожалению, в нем 2112 записей. И они не отформатированы должным образом. Мне нужно отсортировать все эти записи (на основе оценок в последних 2 столбцах - сумма оценок в Aptitude и Computer), чтобы узнать, каков мой ранг.
Я пытался скопировать в MS Word и Excel, но если вы попробуете это, вы увидите, что это не поможет. Вставив его в простой текстовый файл, я попытался отформатировать его с помощью регулярных выражений (в Notepad ++), написал код на C, чтобы правильно разделить каждое поле на «\ t» (чтобы позже я мог правильно скопировать их в лист Excel ), но из-за несогласованности я потерпел неудачу (некоторые записи порождаются несколькими строками, у «имен» нет фиксированных номеров полей).
Может кто-нибудь придумать идею, которая позволит скопировать первый список в PDF в электронную таблицу в виде таблицы точно так же, как исходный файл?