Есть ли способ прочитать в большом документе как data.frame в R? - PullRequest
0 голосов
/ 12 апреля 2020

Я пытаюсь использовать ggplot2 для большого набора данных, сохраненного в файле csv. Я читал это с Excel.

Я не знаю, как преобразовать эти данные в data.frame. В частности, у меня есть столбец даты, который имеет следующий формат: "2020/04/12: 12: 00" . Как я могу получить R, чтобы понять этот формат?

Ответы [ 2 ]

1 голос
/ 12 апреля 2020

Если это csv, вы можете использовать:

  • fread функцию от data.table. Это будет самый быстрый способ прочитать ваш CSV.
  • read_csv или read_csv2 (для документов ; с разделителями) в пакете readr

Если это документ .xls (или .xlsx), имейте посмотрите на пакет readxl.

Все эти функции импортируют ваши данные как data.frame s (с дополнительными классами, такими как data.table для fread или tibble для read_csv).

Редактировать

Учитывая ваш комментарий, похоже, что ваш файл не Excel, а CSV. Если вы хотите преобразовать тип столбца в дату, предполагая, что ваш фрейм данных называется df

df[, dates := as.POSIXct(get(colnames(df)[1]), format = "%Y/%m/%d:%H:%M")]

Обратите внимание, что вам не нужно использовать cbind или даже переназначить data.table, потому что вы используете := operator

Как говорится в сообщении, вам не нужна дополнительная точность POSIXlt

0 голосов
/ 12 апреля 2020

Исходя из одного вопроса, я бы предложил пакет openxlsx, он помог мне значительно сократить время при чтении больших наборов данных. В трех пунктах вы можете найти это полезным, основываясь на вашем вопросе и комментариях

  • Команда чтения остается такой же, как и в пакете xlsx, однако предлагает использовать openxlsx :: read.xslx ( file_path)
  • аргументы опять те же, но вместо sheetIndex это sheet и он принимает только цифры
  • Если существующие столбцы преобразуются в символы, тогда будет работать as.Date
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...