Может кто-нибудь узнать, как эта таблица dplyr не работает? - PullRequest
0 голосов
/ 11 июня 2019

Мне нужно составить таблицу, в которой среднее значение и медиана из логов за месяц указаны из набора данных "txhousing". Упражнение, которое я получил, состоит в следующем: «В таблице ниже показаны средние и средние значения в журнале продаж за месяц, отсортированные по среднему значению»

  • Вставьте новый блок r и введите код для отображения этой таблицы
  • Используйте na.omit, чтобы избавиться от дел с пропущенными значениями
  • Используйте команду dplyr mutate, чтобы сделать переменные logsales
  • Используйте команду dplyr group_by для группировки по месяцам
  • Используйте команду суммировать команду dplyr для отображения таблицы
  • Используйте команду dplyr, чтобы отсортировать по значению
  • Соединить команды с оператором канала%>%

Я пытался смешать код несколько раз, но не могу понять, почему он продолжает давать мне NA в моей таблице.

library(tidyverse)
summary(txhousing)    
na.omit(txhousing)    
txhousing<- as.data.frame(txhousing)
logsales <- log(txhousing$sales)  
group_by(txhousing, txhousing$month)   
txhousing<- txhousing %>% mutate(logsales= log(txhousing$sales))    
txhousing %>% group_by(txhousing$month) %>% summarise(mean(logsales), median(logsales)) %>% arrange(mean)

Я ожидаю получить таблицу со средним значением и медианой логов в месяц, но я получаю только NA в столбце от среднего значения по медиане, и порядок выдает следующую ошибку:

Ошибка: невозможно разместить столбец класса 'function' в позиции 1`

1 Ответ

0 голосов
/ 12 июня 2019

В столбцах есть NA значения, поэтому вам нужно указать mean и median, чтобы они игнорировались. А также назовите столбцы в summarise, чтобы использовать arrange для столбца с именем mean.

txhousing %>% 
  group_by(txhousing$month) %>% 
  summarise(mean = mean(logsales, na.rm = T), 
            med= median(logsales, na.rm = T)) %>% 
  arrange(mean) %>%
  rename(month = `txhousing$month`)

Это создает следующее tibble

# A tibble: 12 x 3
   month  mean   med
   <int> <dbl> <dbl>
 1     1  4.95  4.74
 2     2  5.13  4.93
 3    11  5.19  4.96
 4    12  5.24  5.02
 5    10  5.29  5.08
 6     9  5.32  5.09
 7     3  5.38  5.15
 8     4  5.42  5.21
 9     5  5.52  5.29
10     7  5.53  5.30
11     8  5.53  5.33
12     6  5.56  5.34
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...