Как использовать page.filter (test_function) в библиотеке PDFPlumber? - PullRequest
0 голосов
/ 03 ноября 2018

Я пытаюсь удалить таблицы внутри страницы в формате pdf и пытаюсь использовать для этого функцию page.filter () , здесь у меня есть таблица координаты bbox , и я я пытаюсь сравнить, если координаты объекта находятся внутри координат таблицы или нет. Но мне не удалось найти пример использования функции фильтра.

вот ссылка на документацию

Я пытался таким образом:

def filter_func(object):
  #some logic to find the coordinates inside boundary or not

new_page = page.filter(lambda x: x if filter_func(x) else '')

но, к сожалению, это использование не работает, пожалуйста, помогите узнать, как использовать функцию page.filter

1 Ответ

0 голосов
/ 06 ноября 2018

Нашел, что работает:

def filter_func(object):
 #some logic to find the coordinates inside boundary or not

new_page = page.filter(filter_func)

page.filter является генератором и выполняется только при использовании new_page

...