Я делаю цикл для многих научных работ.Здесь я хочу извлечь из прочитанного документа содержимое.
Как я могу сделать так, чтобы R читал только до последней строки, где много точек, и указать в качестве конечной строки?как на картинке ниже:
[Числа] [Буквы] [Точки] [Число]
Если не многоточки, которые останавливаются и указывают как конец строки.
Например, у меня есть следующий код, но он не работает для других документов, потому что иногда имеют разные окончания.
if(((nrow(pdf[pdf$text == "References ." & pdf$element_id == '2',]) == 1) & !(exists("endline"))) == 1){
endline <- pdf$line_id[pdf$text == "References ." & pdf$element_id == '2']
}
R читает весь документ и идентифицирует только до последнего, где многоточки.