Матрица непредвиденных обстоятельств в R - PullRequest
0 голосов
/ 29 октября 2018

Я пытаюсь построить матрицу непредвиденных обстоятельств для случаев между вызывающим абонентом и вызываемым абонентом. У меня просто проблемы, потому что моя переменная caller_id содержит значения длиной 5 чисел; однако мне нужно разделить значения на основе того, начинаются ли они с 1, 2 или 3. Например, мои данные имеют вид:

CALLER         CALLEE
12345            1
23456            1
35643            2

Где префикс Caller и значение для Callee могут быть 1, 2 или 3, представляющие 1 для белой этнической принадлежности, 2 для черной этнической принадлежности и 3 для неизвестного. Мне нужно создать матрицу непредвиденных обстоятельств, такую ​​как:

              White Caller     Black Caller
White Callee    # of calls    # of calls
Black Callee    # of calls    # of calls
Unknown Callee  # of calls    # of calls

Если у кого-нибудь есть какие-либо советы о том, как я могу разделить значения и создать матрицу, это будет очень цениться. Заранее спасибо.

1 Ответ

0 голосов
/ 29 октября 2018

С основанием R вы можете использовать

with(df, table(CALLER = substr(CALLER, 0, 1), CALLEE))
#       CALLEE
# CALLER 1 2
#      1 1 0
#      2 1 0
#      3 0 1

, где substr(df$CALLER, 0, 1) извлекает первую цифру из df$CALLER (см. ?substr), а затем table выдает таблицу на случай непредвиденных обстоятельств.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...