Как исправить большой фрейм данных в R - PullRequest
0 голосов
/ 30 января 2019

Это должно быть простое решение, но я не очень хорошо понимаю, как R обрабатывает данные.

У меня есть фрейм данных, который является результатом импорта двух столбцов из файла .xlsx.Я пытаюсь использовать библиотеку anytime для преобразования метки времени Unix в дружественную дату R.У меня не было проблем с предыдущим фреймом данных, и из того, что я вижу, этот новый имеет ту же структуру.

Вот dput от каждого фрейма данных:

> dput(head(test3,10))
structure(list(city_name = c(NA, NA, "Northampton", NA, "Parkville", 
"San Jose", "San Jose", NA, "Parkville", "Northampton"), dateline = c(1281496979, 
1313188858, 1313188895, 1313188913, 1313188938, 1313188957, 1313188987, 
1313189030, 1313189067, 1313189204)), row.names = 87:96, class = "data.frame")
> dput(head(user,10))
structure(list(userid = c(1, 1, 1, 3, 5, 4, 6, 4, 3, 5), dateline = c(1281496979, 
1281496979, 1281496990, 1281507443, 1281508294, 1281508362, 1281508399, 
1281508589, 1281508603, 1281508629)), row.names = c(NA, -10L), class = c("tbl_df", 
"tbl", "data.frame"))

The user датафрейм сломан.Когда я пытаюсь запустить в любое время, я получаю эту ошибку:

Ошибка в anytime_cpp (x, tz = tz, asUTC = asUTC, useR = useR, oldHeuristic = oldHeuristic): неподдерживаемый тип

Благодаря собственному устранению неполадок я выяснил, что когда я удаляю "tbl_df", "tbl", из class =, тогда пользовательский информационный фрейм правильно взаимодействует с anytime.Однако размер кадра данных составляет около 900 000 строк, поэтому я не могу решить эту проблему с помощью dput.Как я могу исправить структуру моего user кадра данных?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...