Могу ли я что-то сделать, чтобы получить частичные результаты после столкновения с ошибками в большом файле? Я использую следующую команду для импорта данных из файлов. Это самый быстрый способ, который я знаю, но он не надежный. Это может легко испортить все из-за маленькой ошибки. Я надеюсь, что, по крайней мере, есть способ, которым сканирование (или любой читатель) может быстро вернуть, какая строка / строка имеет ошибку, или частичные результаты, которые она прочитала (чем я буду иметь представление, где ошибка). Затем я могу пропустить достаточно строк, чтобы восстановить более 99% хороших данных.
rawData = scan(file = "rawData.csv", what = scanformat, sep = ",", skip = 1, quiet = TRUE, fill = TRUE, na.strings = c("-", "NA", "Na","N"))
Все учебники по импорту данных, которые я нашел, предполагают, что файлы в хорошем состоянии. Я не нашел полезного совета, чтобы иметь дело с грязными файлами.
Буду искренне признателен за любую подсказку или предложение! Это было действительно неприятно.