В этом случае вы можете использовать np.var(my_numpy_array,ddof=1)
для вычисления дисперсии массива.
Параметр ddof взят из «Delta Degrees of Freeedom», вы можете узнать больше о них здесь: https://en.wikipedia.org/wiki/Degrees_of_freedom_ (статистика) .
В вашем случае, поскольку y рассчитывается по X, я бы вычислил np.var(y)
и проверил бы, чтобы увидеть результат.
Порог выше которые вы считаете ваши данные достаточно разнообразными, зависит от случая.