Я пытаюсь читать в огромном файле построчно с fread в R:
fread(file=path,sep=NULL,header=F)
Fread останавливается с предупреждением в некоторых строках, которые не являются проблемой для read_csv (из readr) или чтения.csv
Пример (я не думаю, что управляющие символы будут отображаться в stackoverflow): this is a problem
Если я смотрю это с cat -A, кажется, что проблемные символыконтрольные символы в начале: ^E^C^?^C^B
Как с этим справиться?
Есть ли выражение регулярного выражения, которое я мог бы использовать, чтобы удалить их?Я пробовал что-то в следующем духе, но я не знаю, создаст ли это другие проблемы:
cat -A <FILE>| awk -F"$" '{gsub(/\^\?/,"",$0);print}'
РЕДАКТИРОВАТЬ: Снимок экрана: