Текст в табличный формат с помощью stringi - PullRequest
1 голос
/ 23 мая 2019

Я пытаюсь перевести текст, извлеченный из некоторых изображений, в табличный формат в R.

Я пытался использовать пакет stringi, чтобы иметь возможность разделить текст на части, ноУ меня проблемы с определением правильного шаблона.Текст объединяет пробелы с числами и текстом, поэтому разделители не являются однородными.

 >data$V1[c(15,16,17,19)]
[1] "FECHA SUCURSAL DESCRIPCION N|| DCTO CHEQUES Y OTROS DEPOSITOS Y OTROS SALDO"
[2] "CARGOS ABONOS"  
[3] "02/05 Agustinas Egreso por Compra de Divisas 4.841 143.340"                  
[4] "03/05 Agustinas Traspaso Internet desde LCr®dit0 5.000"                      

Я имел дело с такими выражениями

stri_split(data$V1[18], regex ="\\s++")

Результат, который я ищу,что-то вроде этого в data.frame:

|------|---------|--------------|------|---------------|-----------------|-------|
|FECHA |SUCURSAL |DESCRIPCION   |N DCTO|CHEQUES Y OTROS|DEPOSITOS Y OTROS|SALDO|
|------|---------|--------------|------|---------------|-----------------|-------|

|------|---------|--------------|------|CARGOS         |ABONOS-----------|-------|
|------|---------|--------------|------|---------------|-----------------|-------|

|02/05 |Agustinas| Egreso por...|------|4.841----------|-----------------|143.340|
|------|---------|--------------|------|---------------|-----------------|-------|
|03/05 |Agustinas|Traspaso .....|------|---------------|5.000------------|-------|
|------|---------|--------------|------|---------------|-----------------|-------|
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...