Итерации в каждом элементе каждого столбца каждого кадра данных в списке, полученном с помощью таблицы
wrapper.read_pdf(file)
, в этом случае
tables
можно получить чистые данные.В этом случае:
prueba =[]
i = 0
for table in tables:
for columna in table.columns:
for item in (str(table[columna]).split(" ")):
if "858" in str(item):
prueba.append(item[0:15])
print (prueba[0:5])
приводит к:
['858000019596025', '858000015903707', '858000013641975', '858000000610864', '858000013428853']
Но
tabula.wrapper.read_pdf
не читает весь исходный pdf.2 значения остались на последней странице.Таким образом, все еще необходимо вручную внести небольшое изменение.