Я хотел бы извлечь данные (прыжки с лыж) из этого PDF http://medias4.fis -ski.com / pdf / 2019 / JP / 3088 / 2019JP3088RL.pdf
Меня интересуют все данные, кроме нагрудник , клуб и дата рождения
Я пытался с pdftools библиотека
pdf_text("raw/data.pdf") %>% strsplit(split = "\n")
и я застрял здесь. Проблема в том, что столбец указывает (компенсация затвора) иногда пуст, а иногда нет Я не знаю, как с этим справиться.
Мой желаемый вывод - что-то вроде этого:
Rank|Athlete |Nation|(...)|Jump_1|Round_1|Jump_2|Round_2|Tot_points
1 |KLIMOV Evgeniy|RUS |(...)|127.5 |130 |131.5 |133.4 |263.4
Кто-нибудь может мне помочь?