R readxl: Как указать типы столбцов выбранных столбцов - PullRequest
0 голосов
/ 10 января 2019

У меня есть таблица Excel с 80 столбцами. Я хочу прочитать только четыре из столбцов. Положение столбцов может измениться, поэтому я хотел бы выбрать их по имени столбца. Я делаю это по

df <- read_xlsx("dat")[c("a", "b", "c", "d")]

Однако d неверно угадывается как логический, хотя на самом деле это фактор с четырьмя уровнями. Тип столбцов может быть установлен col_type, но параметры этой функции относятся к исходным 80 столбцам. Таким образом, чтобы установить правильный тип, мне нужно знать положение столбца, а я нет. Даже если кажется неудобным устанавливать 80 типов столбцов (возможно, с rep()), хотя мне нужно только четыре из них. Чтение всего как текста также не работает, потому что один столбец находится в формате даты: время, который зашифрован этим. У кого-нибудь есть идеи как это решить?

Пакеты с java и perl не работают на моем компьютере.

1 Ответ

0 голосов
/ 10 января 2019

fread находится в пакете data.table и предоставит вам необходимую функциональность.

Описанный как «быстрый и удобный файловый финалер», популярный Пакет data.table чрезвычайно полезен и прост в использовании. Своя фред () функция предназначена для непосредственного импорта данных из обычных файлов с разделителями в R, без каких-либо обходных путей или чепухи. https://www.datacamp.com/community/tutorials/importing-data-r-part-two

df<-fread("path",select=c("col1","col2",..........))
...