Разрыв набора данных регрессии в значениях - PullRequest
0 голосов
/ 17 января 2020

Как вы решаете проблему, если хотите тренировать регрессию, когда между точками данных имеется большой разрыв?

Можете ли вы как-то сгруппировать их в Python?

Спасибо.

С уважением Кидна

enter image description here

1 Ответ

1 голос
/ 17 января 2020

Мой подход состоит в том, чтобы использовать простое уравнение с несколькими параметрами - настолько малым, насколько это практически возможно - когда подстроенное уравнение может только плавно следовать форме данных. Я извлек данные из диаграммы рассеяния, чтобы сделать пример, однако числа на графике очень велики, что дает в этом примере либо очень большие, либо очень маленькие подогнанные значения параметров. Вот простое экспоненциальное уравнение, "y = a * exp (bx)", с подобранными параметрами a = 1.3326440758146755E + 06 и b = 1.7689425357488880E-06. Лично я бы изменил масштаб данных, разделив числа на 1 000 или 1 000 000, чтобы изменить единицы измерения.

plot

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...