Как указал Сид, когда вы спрашиваете, «есть ли более простой способ сделать это», многое зависит от контекста.Если «проще» вы ищете эффективность, то ответ не только в количестве строк кода.
Если вы действительно хотите видеть всю статистику заказов в виде набора, преобразуя свой подходв одну строку, используя возможность конструктора блоков Ruby, возможно, более читабельно, а временные характеристики реализации, представленной ниже, показывают, что это немного быстрее, но только на несколько процентов.
Однако, если у вас очень большие N иобрабатывают значения последовательно, вы можете предпочесть генераторный подход.Реализация, представленная ниже как ordered_random_generator
, - это O (1) вычислений и хранилищ для каждого элемента, что дает O (N) для генерации всего набора, но O (1) для хранения, если вы отбрасываете каждый элемент после его использования.Если вы сохраняете элементы, на практике это медленнее, чем подход, основанный на сортировке, из-за высокой стоимости вычисления k th корней в расчете.
Другая возможность заключается в том, что вы не 'на самом деле интересует весь набор значений, но использует его для получения определенных квантилей или статистики порядка, например, 10-го из 100 упорядоченных элементов.В этом случае вы можете напрямую сгенерировать случайное значение с правильным распределением статистики порядка k th из N за O (1) время с O (1) хранилищем.
Вот реализация различных опций, показывающая время для трех подходов, которые генерируют весь массив, и показывающая правильность распределения четвертого подхода.
# Your original.
# O(N log N) time due to sort, O(N) storage.
def ordered_random1(n, range_spec = 1.0..n)
ary = []
n.times do
value = rand(range_spec)
ary << value
end
ary.sort!
end
# Same sort-based algorithm using Ruby's Array constructor with a block.
# O(N log N) time due to sort, O(N) storage.
def ordered_random2(n, range_spec = 1.0..n)
Array.new(n) { rand(range_spec) }.sort!
end
# Generator which uses distributional properties to generate the minimum of
# k uniforms from k = N down to 1, scaling the result down to the remaining
# sub-range of the original range.
# O(1) time per element, O(1) storage. However, computation time has a very
# large constant due to the transcendental function evaluation for kth root.
def ordered_random_generator(n, range_spec = 1.0..n)
x = range_spec.first
upper = range_spec.last
Enumerator.new do |yielder|
n.times do |i|
range = upper - x
u_min = 1.0 - rand ** (1.0 / (n - i))
x += range * u_min
yielder.yield x
end
end
end
# Use generator to fill array of size N.
# O(N) time and storage.
def ordered_random3(n, range_spec = 1.0..n)
gen = ordered_random_generator(n, range_spec)
Array.new(n) { gen.next }
end
require 'random_variates' # 'gem install random_variates' to get from rubygems
# Use distributional properties of uniform order statistics to directly
# generate instances of the kth of N values.
# O(1) time, O(1) storage.
def kth_of_n_generator(k:, n:, range_spec: 0.0..1.0)
# Uniform order stats have a beta distribution. Beta is a ratio of Gammas.
x = Gamma.new(alpha: k).next
y = Gamma.new(alpha: n - k + 1).next
beta = x / (x + y)
(range_spec.last - range_spec.first) * beta + range_spec.first
end
# Time for Demos!
my_range = 0.1..15.1
puts "SAMPLE OUTPUT FOR RANGE = #{my_range}:"
puts " original: #{ordered_random1(5, my_range)}"
puts "one-liner: #{ordered_random2(5, my_range)}"
puts "generator: #{ordered_random3(5, my_range)}"
puts "direct generation of min & max using kth_of_n_generator: #{
kth_of_n_generator(k: 1, n: 5, range_spec: my_range)
}, #{
kth_of_n_generator(k: 5, n: 5, range_spec: my_range)
}"
REPS = 10_000
n = 9
puts "\nDEMO DISTRIBUTIONAL CORRECTNESS OF SINGLETON GENERATOR (range = 0.0..1.0)"
(1..n).each do |k|
total = Array.new(REPS) { kth_of_n_generator(k: k, n: n) }.inject(:+)
quantile = k.to_f / (n + 1)
suffix = case k
when 1
"st"
when 2
"nd"
when 3
"rd"
else
"th"
end
print "Average of #{REPS} values of #{k}#{suffix} of #{n}: #{total / REPS} "
puts "[Expected value is #{quantile}]"
end
require 'benchmark/ips'
[100, 10_000].each do |n|
puts "\nBENCHMARKING ARRAYS OF SIZE #{n}"
Benchmark.ips do |b|
b.report(' original:') { ordered_random1(n, my_range) }
b.report('one-liner:') { ordered_random2(n, my_range) }
b.report('generator:') { ordered_random3(n, my_range) }
b.compare!
end
end
Вот пример вывода на моеммашина.Время зависит от вашего оборудования, операционной системы и версии Ruby, которую вы используете.Конкретные значения будут варьироваться от прогона к прогоне из-за случайности, но они непротиворечивы.
SAMPLE OUTPUT FOR RANGE = 0.1..15.1:
original: [3.2143763318277223, 3.424117583339602, 4.98763316107166, 7.67915049946293, 13.002051529711663]
one-liner: [3.698584735327408, 3.7940473868424713, 8.133265097991108, 10.797493427133121, 13.519291528088747]
generator: [1.379949057529254, 3.330310564043854, 14.175279996588, 14.187770450655005, 14.747374304212487]
direct generation of min & max using kth_of_n_generator: 2.3844682728553956, 14.093371351681753
DEMO DISTRIBUTIONAL CORRECTNESS OF SINGLETON GENERATOR (range = 0.0..1.0)
Average of 10000 values of 1st of 9: 0.10061353514079374 [Expected value is 0.1]
Average of 10000 values of 2nd of 9: 0.19841217568287062 [Expected value is 0.2]
Average of 10000 values of 3rd of 9: 0.3018753486695847 [Expected value is 0.3]
Average of 10000 values of 4th of 9: 0.40002514960574265 [Expected value is 0.4]
Average of 10000 values of 5th of 9: 0.5003591617651723 [Expected value is 0.5]
Average of 10000 values of 6th of 9: 0.5974291957317844 [Expected value is 0.6]
Average of 10000 values of 7th of 9: 0.6980418879340753 [Expected value is 0.7]
Average of 10000 values of 8th of 9: 0.8012294219961899 [Expected value is 0.8]
Average of 10000 values of 9th of 9: 0.9002379495094114 [Expected value is 0.9]
BENCHMARKING ARRAYS OF SIZE 100
Warming up --------------------------------------
original: 4.037k i/100ms
one-liner: 4.242k i/100ms
generator: 773.000 i/100ms
Calculating -------------------------------------
original: 40.412k (± 2.0%) i/s - 205.887k in 5.096825s
one-liner: 41.852k (± 2.3%) i/s - 212.100k in 5.070662s
generator: 7.676k (± 4.2%) i/s - 38.650k in 5.045488s
Comparison:
one-liner:: 41852.1 i/s
original:: 40412.3 i/s - same-ish: difference falls within error
generator:: 7675.6 i/s - 5.45x slower
BENCHMARKING ARRAYS OF SIZE 10000
Warming up --------------------------------------
original: 29.000 i/100ms
one-liner: 30.000 i/100ms
generator: 7.000 i/100ms
Calculating -------------------------------------
original: 295.387 (± 2.0%) i/s - 1.479k in 5.009243s
one-liner: 304.406 (± 2.0%) i/s - 1.530k in 5.028485s
generator: 78.104 (± 2.6%) i/s - 392.000 in 5.020934s
Comparison:
one-liner:: 304.4 i/s
original:: 295.4 i/s - same-ish: difference falls within error
generator:: 78.1 i/s - 3.90x slower
Обратите внимание, что генераторный подход медленнее, чем два подхода на основе сортировки для обоих протестированных здесь размеров массивов.Разрыв закрывается для массивов больших размеров из-за асимптотики O (N) и O (N log N), но, вероятно, недостаточно, чтобы представлять интерес, если вы в первую очередь фокусируете на скорости.