Я пытаюсь извлечь текст между именем строки и новой строкой. Данные OCR'ы из .pdf и содержатся в кадре данных R.
Например, вывод в файл .csv.
Contract 6001 Total Hours 300, 33,350.00
Contract 6002 Total Hours 500, 500,000.00
Contract 6003 Total Hours 25, 10,050.50
Данные отображаются на новых строках при просмотре в Файл .csv из-за \ n. Однако при выполнении команды str () в R данные отображаются в одной строке и имеют символ '\ n' в конце после суммы в долларах.
Как бы я использовал регулярное выражение для извлечения всего между контрактом и перевод строки для всех строк?
Желаемый вывод:
6001 Total Hours 300, 33,350.00
6002 Total Hours 500, 500,000.00
6003 Total Hours 25, 10,050.50