У меня есть набор данных, который похож на множество экономических данных: логнормальный, но с более длинным правым хвостом.,,или, по крайней мере, так выглядит в qqplot
Temple.df <- read.delim("http://history.emory.edu/RAVINA/Stackoverflow/Temple.txt", header = TRUE, sep = "\t")
##generate theoretical quartiles
vec <- log10(Temple.df$total_land)
y <- quantile(vec[!is.na(vec)], c(0.25, 0.75))
x <- qnorm(c(0.25, 0.75))
slope <- diff(y)/diff(x)
int <- y[1L] - slope * x[1L]
tags <- c(-1,0,1,2,3,4)
library(ggplot2)
ggplot(data=Temple.df, aes(sample=vec)) +
geom_qq(geom = "point", distribution = stats::qnorm) +
geom_abline(intercept = int ,slope = slope) +
scale_y_continuous(breaks=tags, labels=10^tags)
Но когда я пытаюсь наложить кривую на гистограмму, кривая выглядит странносмещено влево.
ggplot(Temple.df, aes(total_land)) +
geom_histogram(color="white", aes(y = ..density..)) +
scale_x_continuous(trans = "log") +
stat_function(fun=dlnorm,
args=list(meanlog = mean(log(Temple.df$total_land)),
sdlog = sd(log(Temple.df$total_land))))
Есть ли ошибка в моем коде?Почему кривая плотности не соответствует гистограмме?В чем моя очевидная ошибка STAT101?