Учитывая объяснение в руководстве крана pdfsearch, вы можете напрямую передать ссылку PDF на keyword_search()
. Таким образом, я не вижу сообщение об ошибке, которое вы предоставили. Я скорее получил следующий результат.
result <- keyword_search("https://wilmar-iframe.todayir.com/attachment/20190411162436345449392_en.pdf",
keyword = c('SUBSTANTIAL SHAREHOLDERS'),
path = TRUE, surround_lines = 1)
keyword page_num line_num line_text token_text
<chr> <int> <int> <list> <list>
1 SUBSTANTIAL SHAREHOLDERS 49 2010 <chr [3]> <list [3]>