Извлечение .pdf таблицы - PullRequest
0 голосов
/ 15 мая 2018

Я написал кусок кода, работающий для получения таблицы .pdf, в которой я заинтересован R , но должен быть лучший способ.Следовательно, у меня нет проблем с импортом данных из PDF.Я ищу ЛУЧШЕ, чем следующее, чтобы извлечь интересующие меня таблицы.

df_st <- "http://www.drustvo-antropologov.si/AN/PDF/2012_2/Anthropological_Notebooks_XVIII_2_Bjelica.pdf"

df_st_table <- extract_tables(df_st)

df_str <- data.frame(matrix(unlist(df_st_table), nrow=195, byrow=T))

df_str_a <- df_str[29:52, ]
df_str_a <- data.frame(matrix(unlist(df_str_a), nrow=24, byrow=T))
df_str_b <- df_str[53:76, ]
df_str_b <- data.frame(matrix(unlist(df_str_b), nrow=24, byrow=T))
df_str_c <- df_str[101:126, ]
df_str_c <- data.frame(matrix(unlist(df_str_c), nrow=26, byrow=T))
df_str_d <- df_str[127:152, ]
df_str_d <- data.frame(matrix(unlist(df_str_d), nrow=26, byrow=T))

... и затем я объединяю их все.Слишком долго и не элегантно.

...