Я хотел бы прочитать файл в R
с помощью функции read.table()
.
Мои входные данные - это большие файлы размером около 25Go
, поэтому я бы хотел наиболее эффективный способ сделать то, что я хочу.
Первые строки моего файла (я не знаю, сколько, поскольку это зависит от файла) начинаются с "@
", который является заголовком моего файла, и я хотел бы пропустить все эти строки.
Я не нашел ничего, имеющего отношение к моей проблеме, поскольку все решения учитывают пропуск определенного числа строк, а это не то, чего я хочу.
Я нашел кое-что о comment.char
но это не работает для того, что я хочу,
Я пытался так:
dat <- read.table(file.name, header=FALSE, comment.char="@", sep="\t")
изменить:
примервведите:
@HD VN:1.4 SO:coordinate
@SQ SN:chr1 LN:249250621
@SQ SN:chr2 LN:243199373
...
9754R:04158:11144 0 chr1 10002 0
2MBNV:09647:08301 0 chr1 10060 2
и вот ошибка, которую я получаю:
Ошибка сканирования (файл = файл, что = что, sep = sep, quote = quote, dec = =dec,: в строке 1 не было 2 элементов Вызовы: read.table -> scan Выполнение остановлено