stddev дает разные результаты для 2 идентичных наборов данных в U- SQL - PullRequest
0 голосов
/ 30 марта 2020

У меня есть 2 набора данных CSV с 1 столбцом 'v'. Данные в этих 2 файлах точно такие же. Столбец 'v' содержит значения, которые будут преобразованы в десятичную? перед выполнением stdev.

значения sum (v), avg (v) одинаковы в обоих наборах данных, но значения stdev не совпадают. Как это вообще возможно?

Вот код,

@ds1 =
EXTRACT v decimal?            
FROM @ds1_path
USING Extractors.Csv(skipFirstNRows : 1);

@ds2 = EXTRACT v decimal?            
FROM @ds2_path
USING Extractors.Csv(skipFirstNRows : 1);

@data =
SELECT STDEV(v) AS stdev,
       SUM(v) AS sum,
       AVG(v) AS avg,
       VAR(v) AS vari,
       "ds1" AS type
FROM @ds1
UNION ALL
SELECT STDEV(v) AS stdev,
       SUM(v) AS sum,
       AVG(v) AS avg,
       VAR(v) AS vari,
       "ds2" AS type
FROM @ds2;

Это дает следующий вывод. Если вы заметили сумму, значения avg точно такие же , но значения VAR и STDEV не совпадают.

Может кто-нибудь помочь, пожалуйста?

вывод

...