Значение даты несоответствия при read.xlsx в R - PullRequest
0 голосов
/ 18 апреля 2019

Я использую функцию read.xlsx в R для чтения листов Excel.Все значения столбца даты «A» имеют форму дд / мм / гггг.Однако при использовании функции read.xlsx значения анализируемой даты варьируются от целого числа, т.е.42283 к строке, т. Е. 20.08.2015.Эта проблема сохраняется, даже когда я использую read.xlsx2.

Я предполагаю, что несоответствие в формате для разных строк затрудняет изменение столбца в единый стандартный формат.Кроме того, трудно указать классы столбцов в файле read.xlsx, поскольку у меня более 100 переменных.

Есть ли способы обойти эту проблему, а также это специфические проблемы Excel?

Спасибо!

1 Ответ

0 голосов
/ 18 апреля 2019

Эта проблема с форматами даты широко распространена, и кажется, что каждый пакет R имеет дело с этим по-своему.Мой опыт работы с read.xlsx состоял в том, что он иногда сохраняет дату в виде символьной строки чисел, например, «42438» в виде символьных данных, которые мне затем нужно преобразовать в числовые, а затем в POSIXct.Затем, в других случаях, кажется, что он сохраняется как числовой, а иногда как символ и время от времени, фактически как POSIXct!Если вы постоянно получаете символьные данные в форме «20/08/2015», попробуйте пакет lubridate:

 library(lubridate)
 dmy("20/08/2015")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...