Ищите формулу кривой колокола, чтобы представить данные, которые имеют нулевое или полное влияние в диапазоне - PullRequest
1 голос
/ 10 июля 2010

a = (0-100)

, когда x = 0, a должно быть 0, когда x = 100, a должно быть 100

, данные должны быть повернуты по кривой к отметке 100, так что после того, как x пройдет 100 a, останется на 100 и не перейдет.

Пояснение и приложение следует:

У нас есть ряд строк данных, которые считаются хорошими, плохими илисомнительный.Если строка плохая, мы считаем ее полной величиной (1,0) по отношению к итоговому значению.поэтому 100 строк с ошибкой o1 = 99% успеха, если строка сомнительна, мы считаем ее процентом от 1 до (возможно, 0,75), поэтому 100 строк с 1 сомнительным результатом дают 99,25% успеха

Я бы хотелвстроить фактор, применимый к этому значению (плохой или сомнительный эффект), который уменьшит его до нулевого эффекта (в любом случае), если имеется только 1 строка данных.так что-то вроде: 1 строка с 1 плохим или сомнительным = 100% успеха (независимо от сомнительного влияния) 2 строки с одним плохим результатом принесут почти 100% успеха 10 строк с одним плохим могут дать 99% успеха 50 строкс 1 плохим результатом будет 99,5% 100 строк с одним плохим результатом даст 99%

эффект, аналогичный сомнительным результатам

Этот фактор, который я пытаюсь получить, будет применен к переменной аффекта для каждогоплохих и сомнительных аффектов.

Этот фактор также не будет влиять на аффект, как только он достигнет определенного значения, в приведенном выше примере 100. Он всегда будет начинаться с 0.

Спасибо залюбая помощь.-Скотт

Ответы [ 2 ]

0 голосов
/ 21 июля 2010

Может ли простая функция формы сделать работу. Что-то вроде

y = 50-50*cos(PI*x/100)    if x>=0 & x<=100

форма кривой http://img839.imageshack.us/img839/297/shapey.png

0 голосов
/ 10 июля 2010

Чтобы соответствовать кривой колокола, вам понадобятся два параметра.Исходя из предоставленных вами данных, вы можете оценить только один параметр, поэтому для соответствия другому вам потребуется больше данных.например.Допустим, вы хотите подогнать нормальную кривую к (среднее значение m и дисперсия v), тогда вы можете легко сказать, что ваша дисперсия равна 50 = (100-0 / 2), но вы все равно не можете измерить m.Вы можете оценить m на основе имеющихся у вас данных и ваших требований.Похоже, вы можете соответствовать любой другой кривой.Учитывая ваш сценарий использования, weibull может быть лучшей кривой, чем нормальная, так как вам не нужна симметричная кривая.

Во-вторых, если это будет любая кривая, она не сможет выполнить утверждение, что x должен оставаться постоянным 100 для a> 100.чтобы достичь этого, вам придется использовать 2 или более уравнения для определения кривой кривой как

f (x) = 0 для x <= 0 </p>

   BellCurve(x) for 0<x<100

   100 for x>=100
...