Как прочитать файл пера с дублирующими столбцами в R - PullRequest
1 голос
/ 26 марта 2020

У меня проблема с чтением файлов данных в формате пера, в котором есть 2+ столбца с дублирующими именами. Можно ли отбросить дублирующие имена на уровне метаданных или каким-либо образом загрузить данные с дублирующими именами.

Пусть, скажем, набор данных "mtcars" сохранен на диске и с помощью

feather_metadata("mtcars")

дает

[32 x 12] @ mtcars

  • миль на галлон: double

  • 'миль на галлон ': двойной

  • миль на галлон: двойной

  • ' цил ': двойной

  • ' disp ': double

При использовании "read_feather("mtcars") выдается ошибка

Ошибка: имена столбцов mpg, mpg не должны дублироваться. Используйте .name_repair для определения исправления.

Как решить эту проблему?

1 Ответ

1 голос
/ 26 марта 2020

Вот решение, которое я нашел - чтение данных по индексам столбцов:

read_feather("mtcars", columns = c(1, 4, 5)

Это позволяет пропускать дублирующие столбцы.

...