встроенный нуль в строку в числовых данных - PullRequest
0 голосов
/ 06 ноября 2019

Используя R, я читаю файл с fread, это файл с множеством столбцов и строк. Файл выглядит так:

1_17118 1_18353 1_21882 1_21955 1_22054
Ind0001  -1      -1      -1      -1
Ind0002  -1      -1      -1      -1
Ind0003  -1      -1      -1      -1
Ind0005  -1      -1      -1      -1
Ind0006  -1      -1      -1      -1

Я перечитываю файл так:

M <- fread("file.txt")

И я получаю следующую ошибку:

Error in fread("file.txt") :
  embedded nul in string: '\xff\xff\xff\001\0\0'
Execution halted

Я прочиталдругой файл, который выглядит очень похоже, и у меня не было этой проблемы раньше.

Мои столбцы, за исключением заголовка и первого столбца, имеют -1, 1 и 0. Я предполагаю, что внутри -1, 1 и 0 должна быть строка, и это вызывает проблему. Вы знаете, как я мог идентифицировать любую строку внутри моего файла? Я попробовал несколько возможностей с grep. Но я не уверен, как искать любую строку. Вы знаете, как я мог решить эту проблему?

1 Ответ

0 голосов
/ 11 ноября 2019

В моем случае проблема с фредом заключалась в размере моего файла (2,7 ГБ). При использовании R версии 3.6.0, fread не смог прочитать весь файл. Решением было разделить мой файл на два файла меньшего размера. Затем я выполнил команду rbind для объединения двух файлов, после чего все заработало нормально.

...