Поиск дубликатов в списке Столбец идентификационных кодов - PullRequest
0 голосов
/ 02 марта 2020

У меня есть набор данных, который я назову "electoral_data" с ~ 15 000 строк. Некоторые из этих строк содержат индивидуальный идентификатор ind_id, который соответствует другому набору данных с такими же идентификаторами. Эти идентификаторы были введены вручную, и мне нужно проверить наличие дубликатов, но столбец ind_id является столбцом списка, который не позволяет работать с несколькими функциями, такими как group_by() из dplyr или get_dupes() из janitor.

  1. Почему списки не работают с этими функциями? Я получаю Error: Column 'ind_id' can't be used as a grouping variable because it's a list
  2. Что заставляет R принять решение сделать этот столбец списком? Я использую sheets_read() из googlesheets4 для чтения в общем листе Google.

Я заставил весь код работать, но мне все еще было любопытно, почему это так.

Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...