Проблема управляющих символов (символ каретки) с data.table :: fread - PullRequest
0 голосов
/ 28 сентября 2018

Я пытаюсь читать в огромном файле построчно с fread в R:

fread(file=path,sep=NULL,header=F)

Fread останавливается с предупреждением в некоторых строках, которые не являются проблемой для read_csv (из readr) или чтения.csv

Пример (я не думаю, что управляющие символы будут отображаться в stackoverflow): this is a problem

Если я смотрю это с cat -A, кажется, что проблемные символыконтрольные символы в начале: ^E^C^?^C^B

Как с этим справиться?

Есть ли выражение регулярного выражения, которое я мог бы использовать, чтобы удалить их?Я пробовал что-то в следующем духе, но я не знаю, создаст ли это другие проблемы:

cat -A <FILE>| awk -F"$" '{gsub(/\^\?/,"",$0);print}'

РЕДАКТИРОВАТЬ: Снимок экрана: control characters

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...