Камелот обрабатывает одни и те же ячейки разными рядами - PullRequest
0 голосов
/ 06 апреля 2019

Камелот рассматривает некоторые строки как отдельные, хотя на самом деле это не так.Результатом являются строки, которые должны были принадлежать предыдущей строке.

Я работаю с Камелотом, чтобы извлечь данные из банковских выписок.Проблема в том, что Камелот рассматривает некоторые строки как отдельные, хотя на самом деле это не так.?Как вы можете видеть на прилагаемом изображении, транзакция 9/9/2019 разбита на 3 строки, когда фактически она только одна.Это происходит, когда описание состоит из более чем одной строки (оригинальное заявление прилагается).

Я попытался оптимизировать row_tol и col_tol, но безуспешно.Любое решение в Камелоте?Если нет, что бы быстро исправить в PANDAS?

tables = camelot.read_pdf('BOA1.pdf',flavor='stream', flag_size=True)
tables

enter image description here

enter image description here

...