У меня есть более 100 000 фрагментов данных, над которыми я работаю, и проблема в том, что они были написаны в очень неподходящем формате, pdf. Я понятия не имею, как разделить данные. Я использую панды и matplotlib, чтобы сделать некоторые базовые черчения на этих данных. Я не могу понять, как сделать CSV из этого.
Например:
Property 1
Data 1
Data 2
Data 3
Property 2
Data 4
Data 5
Data 6
Я пытался использовать поиск и замену, но без форматирования я не могу понять, но у меня нет времени буквально просматривать каждыйчасть данных и добавление запятой вручную.
Я надеюсь, что я смогу построить каждое свойство в виде столбца, где каждый элемент данных будет ячейкой.