Сводный вывод в независимый набор данных - PullRequest
1 голос
/ 29 марта 2020

Я работаю с набором данных Twitter, который я получил с помощью rtweet. Я работал, чтобы создать переменную состояния, основанную на координатах (когда доступно). мой вывод такой:

> summary(rt1$state)
             alabama              arizona             arkansas           california             colorado          connecticut 
                   3                    6                    2                  104                    5                    1 
            delaware district of columbia              florida              georgia                idaho             illinois 
                   1                    0                   17                    7                    0                   12 
             indiana                 iowa               kansas             kentucky            louisiana                maine 
                   4                    1                    2                    3                    2                    1 
            maryland        massachusetts             michigan            minnesota          mississippi             missouri 
                   1                    2                    9                    6                    0                    2 
             montana             nebraska               nevada        new hampshire           new jersey           new mexico 
                   0                    3                    5                    1                    4                    7 
            new york       north carolina         north dakota                 ohio             oklahoma               oregon 
                  25                    8                    1                    3                    2                    4 
        pennsylvania         rhode island       south carolina         south dakota            tennessee                texas 
                  22                    0                    2                    1                    3                   35 
                utah              vermont             virginia           washington        west virginia            wisconsin 
                   2                    1                    3                    5                    0                    2 
             wyoming                 NA's 
                   1                17669 

Не могли бы вы посоветовать, как мне создать независимый набор данных из вышеприведенного вывода, чтобы у меня было 2 столбца (состояние и n)?

спасибо

Ответы [ 2 ]

1 голос
/ 29 марта 2020

Или, может быть, вы можете работать напрямую с вашим rt1 фреймом данных:

dplyr::count(rt1, state)
1 голос
/ 29 марта 2020

Мы можем заключить в stack, чтобы создать два столбца data.frame из кода ОП

out <- stack(summary(rt1$state))[2:1]
names(out) <- c("state", "n")

Или другой параметр в base R это

as.data.frame(table(rt1$state))

Воспроизводимый пример

data(iris)
out <- stack(summary(iris$Species))[2:1]

Или с table

as.data.frame(table(iris$Species))

Или enframe с tibble

library(tibble)
library(tidyr)
enframe(summary(rt1$state)) %>%
   unnest(c(value))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...