Формула для вычисления Prob
не очень хорошо реализована в этом вопросе. он добавляет 1 к DF$Prob
и затем берет его length
, когда он должен добавить 1 к length
.
DF <- data.frame(A, Rank)
DF$Prob <- DF$Rank/(length(DF$Rank) + 1)
ggplot(data = DF, aes(x = Prob, y = A)) +
geom_line() +
scale_x_continuous(breaks = seq(0, 1, by = 0.20),
labels = percent) +
scale_y_continuous(trans = "log10")
Код создания данных.
Я изменил пример набора данных.
Код ниже воспроизводим, поскольку используется set.seed
и sample
имеет уменьшающиеся вероятности.
set.seed(1234)
A <- sample(0:5000, 2500, prob = exp(seq(10, 0, length.out = 5001)))
A <- A[order(A, decreasing = TRUE)]
Rank <- 1:2500