Пропустить строку, начинающуюся с «@» с read.table () в R - PullRequest
0 голосов
/ 22 мая 2019

Я хотел бы прочитать файл в R с помощью функции read.table().
Мои входные данные - это большие файлы размером около 25Go, поэтому я бы хотел наиболее эффективный способ сделать то, что я хочу.

Первые строки моего файла (я не знаю, сколько, поскольку это зависит от файла) начинаются с "@", который является заголовком моего файла, и я хотел бы пропустить все эти строки.

Я не нашел ничего, имеющего отношение к моей проблеме, поскольку все решения учитывают пропуск определенного числа строк, а это не то, чего я хочу.

Я нашел кое-что о comment.charно это не работает для того, что я хочу,

Я пытался так:

dat <- read.table(file.name, header=FALSE, comment.char="@", sep="\t")

изменить:

примервведите:

@HD VN:1.4  SO:coordinate
@SQ SN:chr1 LN:249250621
@SQ SN:chr2 LN:243199373
...
9754R:04158:11144   0   chr1    10002   0
2MBNV:09647:08301   0   chr1    10060   2

и вот ошибка, которую я получаю:

Ошибка сканирования (файл = файл, что = что, sep = sep, quote = quote, dec = =dec,: в строке 1 не было 2 элементов Вызовы: read.table -> scan Выполнение остановлено

...