Я имею дело с очень сложным в работе набором данных: плотность личинок рыб.Это полунепрерывные данные с 90% нулей и асимметричным распределением с очень очень большими значениями.
Одна проблема состоит в том, что мои нули имеют два источника: истинный и ложный, или структурный и выборочный.
Я видел модели, которые могут работать с этими двумя типами нулей, называемые моделями с нулевым раздувом, нотолько для подсчета данных.Я не видел модели для полунепрерывных данных, которые могут иметь дело с ложными нулями.Эти модели состоят из двух частей с логарифмическим или гамма-распределением, и все они принимают истинные нули.
Любая помощь, пожалуйста?
Вот часть моего набора данных: Мойответ - плотность личинок рыб (Dprochilodus).И у меня много нулей, но я не могу предположить, что все они истинно нули.То, что я хочу сказать: когда у меня ноль, это не значит, что не было личинок.Может быть потому, что я не смог их отобрать / обнаружить. Здесь приведены некоторые пояснения относительно различных моделей для истинных и ложных нулей
ponto Dprochilodus periodo Dif_his.y temp
Length:574 Min. : 0.0000 I :278 Min. :0.01571 Min. :21.00
Class :character 1st Qu.: 0.0000 II:296 1st Qu.:0.09738 1st Qu.:24.00
Mode :character Median : 0.0000 Median :0.22505 Median :27.00
Mean : 0.5949 Mean :0.25405 Mean :26.87
3rd Qu.: 0.0000 3rd Qu.:0.40296 3rd Qu.:29.01
Max. :134.7469 Max. :0.89746 Max. :33.00