Как сделать список переменных, используя набор данных Excel в R (R New ie) - PullRequest
0 голосов
/ 27 января 2020

Я пытаюсь отобразить некоторые отношения. У меня есть лист Excel с первым столбцом, в котором указан идентификационный номер учетной записи, а в следующих столбцах указаны идентификационные номера связанных учетных записей. Если бы у меня был доступ на работе, я бы построил реляционную базу данных и начал бы с нее, но я не знаю, и я не уверен, что создание реляционной базы данных помогло бы с приложением, которое мне нужно написать. Я хотел бы написать al oop, который берет номер счета в столбце 1 и связывает его с каждым столбцом, в котором есть связанный счет (он зависит от того, какой аккаунт от одного связанного аккаунта до дюжины). Я думаю, что это своего рода переменная списка, где каждый идентификатор учетной записи работает как уникальный идентификатор для всех связанных учетных записей.

Я потратил кучу времени, читая теорию переменных списка, и кажется, что это именно то, что мне нужно. Это то, что я могу сделать в R? пример электронной таблицы ... не настоящий, потому что это конфиденциально Желаемый вывод

1 Ответ

0 голосов
/ 27 января 2020

Хорошо, это ваши данные:

df

# A tibble: 3 x 6
     ID Related1 Related2 Related3 Related4 Related5
  <dbl>    <dbl>    <dbl>    <dbl>    <dbl>    <dbl>
1  1111     1211     1212       NA       NA       NA
2  2222     1211     1212     1333       NA       NA
3  3333     4210     5689     8756     6245     5151

Теперь, я думаю, это то, что вы хотите:

df %>%
  gather(key = key, value = Related, -ID) %>%
  select(-key) %>%
  na.omit() %>%
  arrange(ID, Related)

# A tibble: 10 x 2
      ID Related
   <dbl>   <dbl>
 1  1111    1211
 2  1111    1212
 3  2222    1211
 4  2222    1212
 5  2222    1333
 6  3333    4210
 7  3333    5151
 8  3333    5689
 9  3333    6245
10  3333    8756

Правильно?

...