Загрузка информации о столбце на полпути останавливается только для одного столбца - PullRequest
0 голосов
/ 14 сентября 2018

Для исследования взгляда я загружаю «большие» .txt файлы в R. В большинстве случаев это происходит как ожидалось.Однако в некоторых случаях он прекращает импорт данных столбца «Iview» и возвращает NA для каждой следующей строки.

Странно то, что в файле .txt нет разницы между последней строкой, которая была правильно импортирована, и следующей строкой.

  # Determine row when relevant GAZE data starts
  first.index <- grep("IviewTimestamp", readLines("example.txt"))[1]

  # Import gaze data
  G.t <- suppressWarnings(suppressMessages(read_table2(file = "example.txt"
                                                       col_names = F,
                                                       skip = first.index-1, 
                                                       progress = F)))


  G.df <- data.frame(G.t[, c(5, 7, 9, 10, 12, 13, 15)])

  colnames(G.df) <- c("Iview","OST", "GLX", "GLY", "GRX", 
                      "GRY", "DisR")

Итак, чтобы показать вам, что происходит:

enter image description here

Как вы можете видеть, он внезапно прекращает импортировать Iview, тогда как другие переменные по-прежнему загружаются правильно.

ЛюбойИдея, что вызывает это?Вот ссылка на файл «example.txt»: https://wetransfer.com/download/21b96d13ce04c64c8b5652ccc8d0555520180914121457/41b3c8

Для тех, кто не хочет скачивать файл .txt:

Gaze Data - IviewTimestamp 2147479211 OpenSesameTimeStamp 489482.0 
GazeLeft 720.346436728 479.952201339 GazeRight 827.973058949 
454.028017843 DistanceRight 628.052580903 DiameterLeft 3.53796282015 
DiamaterRight 3.6109109419
Gaze Data - IviewTimestamp **2147483209** OpenSesameTimeStamp 489485.0 
GazeLeft 721.273134082 478.473368041 GazeRight 828.55963406 
455.075058476 DistanceRight 627.613681923 DiameterLeft 3.53561314881 
DiamaterRight 3.60554349529
Gaze Data - IviewTimestamp 2147487207 OpenSesameTimeStamp 489490.0 
GazeLeft 723.172929117 475.651601215 GazeRight 829.518381282 
457.763442162 DistanceRight 627.118021226 DiameterLeft 3.53771978788 
DiamaterRight 3.60483212601

Я сам добавил ** ** чтобы показать вам, где мы находимся в файле.

то, что я пробовал до сих пор - удалить все строки, которые были загружены правильно, и загрузить часть, которая не была загружена ранее успешно.Это происходит после удаления первых строк.- Добавление дополнительного пробела в файле .txt между двумя входными строками, где появляется NA.Не решает проблему.- Добавление конкретных спецификаций столбцов для всех столбцов.

Есть предложения?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...