У меня есть два набора данных x-y, которые образуют два потенциально связанных графика рассеяния.
Первый набор данных имеет приблизительную область от 0 до 25 000 и диапазон от 0 до 0,3.
Второй набор данных имеет приблизительную область от 0 до 550 и диапазон от 0 до 4,5. Первый набор данных намного более точен и может считаться правильным, поэтому я пытаюсь сравнить второй набор с первым, чтобы выяснить, коррелируют ли эти два набора. Второй набор также является инверсией первого.
Визуализация первого набора данных:
![pic1](https://i.stack.imgur.com/xjnlB.png)
Визуализация второго набора данных:
![pic2](https://i.stack.imgur.com/thXrK.png)
Данные хранятся в форме data: { xAxis: [0,1,2,3,4...], yAxis: [0.20779456198215485, 0.20824825763702393, 0.20915564894676208, 0.20960935950279236...] }
для каждого набора данных.
Подход:
У меня проблемы с поиском решения этой проблемы. Мои первые мысли заключаются в том, чтобы уменьшить первый набор данных, сделав его менее точным с точки зрения точек данных, чтобы удалить ~ 20 000 точек данных с равномерным интервалом или чем-то еще. Я мог бы разбить графики на периодические фрагменты и затем использовать что-то вроде regression-js , чтобы сделать полиномиальную регрессию 3-й степени с regression.polynomial(data[, options])
и сравнить константы регрессии двух функций, чтобы увидеть, насколько они коррелируют. Тем не менее, это может быть совершенно неверным подходом для кого-то более опытного.
Любой совет будет принят с благодарностью.