Как соотнести два набора данных x-y с полиномиальной регрессией? - PullRequest
0 голосов
/ 10 июля 2019

У меня есть два набора данных x-y, которые образуют два потенциально связанных графика рассеяния.

Первый набор данных имеет приблизительную область от 0 до 25 000 и диапазон от 0 до 0,3. Второй набор данных имеет приблизительную область от 0 до 550 и диапазон от 0 до 4,5. Первый набор данных намного более точен и может считаться правильным, поэтому я пытаюсь сравнить второй набор с первым, чтобы выяснить, коррелируют ли эти два набора. Второй набор также является инверсией первого.

Визуализация первого набора данных: pic1

Визуализация второго набора данных: pic2

Данные хранятся в форме data: { xAxis: [0,1,2,3,4...], yAxis: [0.20779456198215485, 0.20824825763702393, 0.20915564894676208, 0.20960935950279236...] } для каждого набора данных.

Подход:

У меня проблемы с поиском решения этой проблемы. Мои первые мысли заключаются в том, чтобы уменьшить первый набор данных, сделав его менее точным с точки зрения точек данных, чтобы удалить ~ 20 000 точек данных с равномерным интервалом или чем-то еще. Я мог бы разбить графики на периодические фрагменты и затем использовать что-то вроде regression-js , чтобы сделать полиномиальную регрессию 3-й степени с regression.polynomial(data[, options]) и сравнить константы регрессии двух функций, чтобы увидеть, насколько они коррелируют. Тем не менее, это может быть совершенно неверным подходом для кого-то более опытного.

Любой совет будет принят с благодарностью.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...