Определение точки изменения с использованием наименьшей суммы квадратов невязок (двухфазная линейная регрессия) - PullRequest
0 голосов
/ 01 мая 2020

У меня есть накопленная сумма данных об осадках, и я хотел бы определить точку изменения с наименьшей суммой квадратов остатков (SSR), используя двухфазную модель линейной регрессии. Вот данные -

a<-structure(list(DAY=1:200,CUMSUM=c(0.4975167,0.4975167,0.4975167,0.4975167,0.4975167,
0.4975167,0.55045359,0.6252087,0.68326339,0.77695034,0.77695034,0.77695034,0.77695034,
0.77695034,0.77695034,0.77695034,0.77695034,0.77695034,0.77695034,0.77695034,0.77695034,
0.77695034,0.77695034,0.77695034,0.77695034,0.77695034,0.77695034,0.78782371,0.78782371,
0.78782371,1.03950021,1.03950021,1.03950021,1.044249829,1.887166329,7.275246329,15.43777033,
15.86143903,20.02444103,25.91613603,26.27224823,31.62583723,31.62583723,31.62583723,
31.62583723,32.06164673,32.06164673,32.09113609,32.09113609,32.31486939,32.53086649,
32.69404529,32.69887801,32.69887801,32.69887801,32.69887801,32.69887801,32.69887801,
32.69887801,32.69887801,32.69887801,32.76850286,32.76850286,32.76850286,34.38806886,
35.15059696,35.15059696,35.17191016,35.17191016,35.17191016,35.89604506,37.79523006,
38.91062906,42.01345806,43.07697206,43.24430266,47.23448666,47.64692766,47.64692766,
47.64692766,47.64692766,47.64692766,47.71434354,49.10115554,49.60093624,49.71193614,
49.71193614,49.71193614,49.71193614,49.71193614,49.75737655,50.03237955,50.49420995,
50.543521,53.758917,69.469847,71.634262,80.561103,81.0511546,81.8669166,82.2741689,
84.8077339,92.6058159,94.8547169,95.2502439,95.2502439,95.2502439,96.3743419,
106.7631619,117.8849019,118.9028679,124.7232399,131.9479449,144.0681049,157.2011649,
170.0676949,171.5463129,173.2228369,174.8507509,176.5680759,177.5140754,179.8159774,
180.3869275,180.708029,182.810761,205.045081,208.064288,221.407228,223.440328,
225.378739,227.574139,230.316327,234.359699,239.339686,249.285726,254.530601,258.851446,
259.876842,262.868797,269.3764,279.346905,289.781865,296.474332,316.070712,360.530472,
394.090652,420.136432,427.588307,435.5426,454.47683,475.07557,476.34619,480.382171,
485.839454,487.668204,491.538405,518.020495,551.653865,574.162415,588.321755,607.128845,
619.989315,643.445565,670.522415,687.704505,697.931485,713.849635,726.942465,736.040755,
753.143285,767.589345,780.219885,781.401867,781.6820652,781.6820652,781.9534316,782.0640614,
782.0960854,782.1381057,782.1381057,782.1381057,782.2945485,782.4209258,784.6749738,
789.4316768,804.3474768,819.1349368,834.4669568,836.6907208,854.9105708,858.1095158,
862.6569488,864.7032878,867.1775338,873.0479408,877.8382878,896.0620678,927.5685878,
962.9229278,992.6912478), .Names = c("DAY","CUMSUM"), class = "data.frame", 
row.names = c(NA, -200L))

Метод определения точки изменения с наименьшим SSR с использованием двухфазной линейной регрессии

Ожидаемый результат должен быть нанесен, как указано в рисунок

Я много искал, но не смог найти ни одного пакета в R.

Можете ли вы предложить метод для получения результата в R или NCL?

Заранее спасибо.

Ссылка для доступа к исследовательской статье, в которой использовался тот же метод, то есть определение точки изменения с наименьшим SSR с использованием двухфазной линейной регрессии

...