Я пытаюсь перевести текст, извлеченный из некоторых изображений, в табличный формат в R.
Я пытался использовать пакет stringi, чтобы иметь возможность разделить текст на части, ноУ меня проблемы с определением правильного шаблона.Текст объединяет пробелы с числами и текстом, поэтому разделители не являются однородными.
>data$V1[c(15,16,17,19)]
[1] "FECHA SUCURSAL DESCRIPCION N|| DCTO CHEQUES Y OTROS DEPOSITOS Y OTROS SALDO"
[2] "CARGOS ABONOS"
[3] "02/05 Agustinas Egreso por Compra de Divisas 4.841 143.340"
[4] "03/05 Agustinas Traspaso Internet desde LCr®dit0 5.000"
Я имел дело с такими выражениями
stri_split(data$V1[18], regex ="\\s++")
Результат, который я ищу,что-то вроде этого в data.frame:
|------|---------|--------------|------|---------------|-----------------|-------|
|FECHA |SUCURSAL |DESCRIPCION |N DCTO|CHEQUES Y OTROS|DEPOSITOS Y OTROS|SALDO|
|------|---------|--------------|------|---------------|-----------------|-------|
|------|---------|--------------|------|CARGOS |ABONOS-----------|-------|
|------|---------|--------------|------|---------------|-----------------|-------|
|02/05 |Agustinas| Egreso por...|------|4.841----------|-----------------|143.340|
|------|---------|--------------|------|---------------|-----------------|-------|
|03/05 |Agustinas|Traspaso .....|------|---------------|5.000------------|-------|
|------|---------|--------------|------|---------------|-----------------|-------|