Ошибка стандартного отклонения для EcoTest.sample - PullRequest
0 голосов
/ 09 января 2019

Я использую EcoTest.sample для сравнения кривых разрежения для 19 участков растительности на двух типах почв (аллювиальная и каньонная). Код ниже производит следующее

предупреждение (более 50 раз): «В кор (х> 0): стандартное отклонение равно нулю».

Тест все еще выдает все ожидаемые результаты. Должен ли я быть обеспокоен предупреждениями? Это результат моего сравнительно небольшого размера выборки?

rawdata<-read.table(text="Plot  SiteType    sp1 sp2 sp3 sp4 sp5 sp6 sp7 sp8 sp9 sp10    sp11    sp12    sp13    sp14    sp15    sp16    sp17    sp18    sp19    sp20    sp21    sp22    sp23    sp24    sp25    sp26    sp27    sp28    sp29    sp30    sp31    sp32    sp33    sp34    sp35
2   canyon  1   0   1   0   1   1   0   1   0   0   1   0   0   0   1   0   0   0   0   0   1   0   0   0   0   0   0   0   0   0   1   0   1   0   0
3   alluvial    1   0   0   0   0   1   1   1   0   0   0   0   0   0   1   0   0   1   0   0   0   0   0   0   0   0   0   0   0   1   0   0   1   0   0
5   alluvial    1   0   0   0   0   0   0   1   1   0   0   0   0   1   1   0   0   1   0   0   0   0   0   0   0   1   0   0   0   0   0   0   1   0   0
6   alluvial    1   0   0   0   0   1   0   0   0   0   0   0   0   0   1   0   0   0   1   0   1   1   0   0   0   1   0   0   0   0   0   0   1   0   0
7   alluvial    1   0   0   1   1   0   0   0   0   0   0   0   0   1   0   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0   0   0   1   0   0
8   alluvial    1   0   1   0   0   0   0   0   0   1   0   0   0   0   1   0   0   0   0   1   0   1   0   0   0   0   0   0   0   0   1   0   1   0   0
10  alluvial    1   0   1   0   0   1   0   0   0   0   0   1   0   0   0   0   0   0   1   0   0   1   0   0   0   0   0   0   1   0   1   1   1   0   0
11  canyon  1   1   0   0   0   1   0   0   0   0   0   0   0   1   1   0   0   0   0   0   1   0   1   0   0   0   1   0   1   0   0   0   1   0   0
12  canyon  0   0   0   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0   0   0   0   1   0   0   0   0   0   0   0   0   0   0   0   0   0
13  canyon  1   0   0   0   0   1   0   0   0   0   0   0   0   0   1   0   0   0   0   0   1   0   0   1   0   0   0   0   0   1   0   0   0   0   0
14  canyon  1   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0   0   0   0   0   0   0   0   0   0
15  canyon  1   0   0   0   0   1   0   0   0   0   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0   0   0   0   1   1   0   0   0   0   0
16  canyon  1   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0   0   0   0   0   0   0   0   0   0
17  canyon  1   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   1   0   0   1   0   0   0   0   0   0   0   0   0   0
18  canyon  1   0   0   0   0   0   0   0   0   0   0   0   0   0   1   1   1   0   0   0   0   0   0   0   0   0   0   0   0   1   0   0   1   0   0
19  canyon  1   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   1   0   1   0   0   0   0   0   0   0   0   0   1   0
20  canyon  1   0   0   0   0   1   0   0   0   0   0   0   0   1   1   0   0   0   0   0   0   1   0   0   0   0   0   0   0   0   1   0   0   0   1
22  alluvial    1   0   0   0   0   1   0   0   0   1   0   0   1   0   1   0   0   0   0   0   0   1   0   1   1   0   0   1   0   1   0   0   1   0   0
23  alluvial    1   0   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0   0   1   0   0   1   0   0   1   0   0   0   0   0   1   0   0   0   0
", header=T)


data<-rawdata[,-1]
rownames(data)<-rawdata[,1]

test.data<-EcoTest.sample(data[,-1], by=data$SiteType, MARGIN=1, trace=F)

1 Ответ

0 голосов
/ 09 января 2019

РЕДАКТИРОВАТЬ : Возможно, вам нужно установить характер индекса с помощью q. Например, если я использую q=2 обратный индекс Симпсона, я не могу воспроизвести вашу ошибку. В настоящее время вы используете q = 0, видовое богатство. Возможно, тут нечего делать, кроме использования другого индекса. Я не знаю о факторах, влияющих на выбор индекса. Я прочитал одну или две вещи здесь: http://www.tiem.utk.edu/~gross/bioed/bealsmodules/shannonDI.html и нашел эту статью, которую я не вдавался в подробности: https://dx.doi.org/10.1002%2Fece3.1155 Использование индекса Симпсона : Предупреждений нет.

test.data<-EcoTest.sample(data[,-1], by=data$SiteType, MARGIN=1, trace=F,q=2)
Sample-based method 
P(Obs <= null) =  0.205 

Как указано в этом ответе по SE, стандартное отклонение, равное нулю, будет влиять на характер распределения. Поэтому любые выполняемые вами тесты, которые могли зависеть от нормального распределения, скорее всего будут ошибочными. Таким образом, p-значения, полученные с помощью t-критерия, могут быть «незначительными».

Когда стандартное отклонение равно нулю, ваш гауссовский (нормальный) PDF превращается в дельта-функцию Дирака. Вы не можете просто вставить нулевое стандартное отклонение в обычное выражение. Например, если PDF-файл подключен к какой-либо числовой интеграции, это не сработает. (Аксакал на ЮВ) https://stats.stackexchange.com/questions/233834/what-is-the-normal-distribution-when-standard-deviation-is-zero

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...