Так что это вопрос математики, рубина, статистики, и я просто не знаю, с чего начать, например, это может быть гораздо больше, чем я готов на момент, но, возможно, кто-то сможет пролить свет на то, как реализовать решение для такого рода вещей.
По сути, у меня есть набор целых чисел, скажем, мой хеш выглядит примерно так:
{ :count => 20, :timestamp => 1304566372 }
{ :count => 23, :timestamp => 1304566382 }
{ :count => 23, :timestamp => 1304566392 }
{ :count => 24, :timestamp => 1304566402 }
{ :count => 25, :timestamp => 1304566412 }
{ :count => 22, :timestamp => 1304566422 }
{ :count => 12, :timestamp => 1304566432 } # <= outlier
{ :count => 21, :timestamp => 1304566442 }
{ :count => 20, :timestamp => 1304566452 }
И этот набор данных будет намного больше, но это может служить просто примером, поэтому я хочу найти результаты, которые больше всего отличаются от средних, однако целые числа будут следовать своего рода кривой, поэтому Вы не можете просто усреднить весь набор. Картинка как аналитика посетителей сайта.
Полагаю, мой вопрос, используя ruby, могу ли я использовать математику, чтобы как-то обобщить кривую и выяснить, какие элементы отличаются наиболее далеко от среднего значения в этом сегменте кривой?
Я не лучший математик, поэтому я могу использовать неверные термины, чтобы описать это. Большое спасибо за любую помощь или советы всем, ребята!