У меня есть набор данных, который я назову "electoral_data" с ~ 15 000 строк. Некоторые из этих строк содержат индивидуальный идентификатор ind_id
, который соответствует другому набору данных с такими же идентификаторами. Эти идентификаторы были введены вручную, и мне нужно проверить наличие дубликатов, но столбец ind_id
является столбцом списка, который не позволяет работать с несколькими функциями, такими как group_by()
из dplyr или get_dupes()
из janitor.
- Почему списки не работают с этими функциями? Я получаю
Error: Column 'ind_id' can't be used as a grouping variable because it's a list
- Что заставляет R принять решение сделать этот столбец списком? Я использую
sheets_read()
из googlesheets4 для чтения в общем листе Google.
Я заставил весь код работать, но мне все еще было любопытно, почему это так.
Спасибо!