Расчет перекоса с использованием scipy.stats
from scipy.stats import skew
val = [120.7, 120.5, 120.4, 120.2, 120.1]
skew(val)
0.13802317223314806
Расчет перекоса с использованием Excel, упорядочение значений в каждой строке в одном столбце и использование функции перекоса
=SKEW(A1:A5)
0.2057527971
Почему существует разница в перекосе? То же самое происходит с pandas и pyspark. При вычислении перекоса с помощью pyspark он дает тот же результат, что и scipy, а при вычислении с помощью pandas он дает тот же результат, что и excel