У меня странная ошибка в некоторых фреймах данных, над которыми я работаю, смещение всех моих строк на одну ячейку, чтобы они больше не соответствовали моим данным:
Вместо этого:
> head(xaa.small)
AGCATTCGAAACATCGAGGCTAACATCCAGTACGCAAGTGGCC AGCATTCGAAACATCGCCAGTTCAATCCATCTTCACAGTGGCC
hg19_ENSG00000000003 0 0
hg19_ENSG00000000419 0 0
hg19_ENSG00000000457 0 0
Это выглядит так:
> head (xab.small)
AGCATTCGAAACATCGAGGCTAACATCCAGTACGCAAGTGGCC AGCATTCGAAACATCGCCAGTTCAATCCATCTTCACAGTGGCC
0 0
hg19_ENSG00000103160 0 0
hg19_ENSG00000103168 0 0
На некоторых кадрах данных появляется пустое место.
Как я могу стереть его и "восстановить" мой кадры в R? Или импортировать это более эффективно? fill = True
при импорте кадра данных работает, но блокирует меня для дальнейшего анализа, который я должен сделать.
Данные поступают из огромного файла TSV, который был разрезан на несколько частей. Возможно, в процессе вырезания произошла ошибка (была использована функция split
, чтобы разрезать исходный файл tsv в несколько файлов размером 200 Мб)