Почему Log1p для выполнения преобразования журнала не отображается как нормализованная гистограмма? - PullRequest
0 голосов
/ 30 ноября 2018

Я новичок в R, пытаюсь использовать log1p для нормализации моих данных, которые в настоящее время искажены.Но когда я создаю нормализованную гистограмму, она строит один сплошной квадратный блок, а не нормализованные ячейки.Как я могу это исправить?

# Histogram of SalePrice with skewed-right distribution 
ggplot(data=train, aes(train$SalePrice)) + 
  ggtitle("Histogram for Sale Price") + 
  xlab("Sale Price") +
  ylab("Count")+
  geom_histogram(binwidth = 10000)

# We can normalize the data by way of log-transformation
train$SalePrice <- log1p(train$SalePrice)

# Histogram of SalePrice with normal distribution 
ggplot(data=train, aes(train$SalePrice)) + 
  ggtitle("Histogram for Sale Price") + 
  xlab("Sale Price") +
  ylab("Count")+
  geom_histogram(binwidth = 10000)

Гистограмма с перекосом вправо Гистограмма в виде сплошного блока

1 Ответ

0 голосов
/ 30 ноября 2018

Ответ пользователя docendo discimus: «Это потому, что log1p (6e5) = 13.30469, и вы устанавливаете пропускную способность 10000. Следовательно, все значения вашей продажной цены находятся в одной корзине. Попробуйте запустить ее, не задавая пропускную способность. Также обратите внимание:не используйте вместо этого ggplot (data = train, aes (train $ SalePrice)), но используйте ggplot (data = train, aes (SalePrice)). - docendo discimus "

...