Линейное преобразование для зашумленных данных в python - PullRequest
1 голос
/ 30 сентября 2019

У меня есть набор данных, который вы видите ниже. Данные довольно шумные, но есть четкая линейная тенденция, которая идет вверх и вправо. Я хотел бы преобразовать данные с y = m * x, чтобы сделать линии горизонтальными. По сути, я хотел бы сделать регрессию на оранжевых линиях, чтобы вывести наклон, но я не знаю, как извлечь различные линейные кластеры. Есть ли хороший метод для преобразования данных, как это? Я использую python / pandas / numpy.

enter image description here

1 Ответ

1 голос
/ 30 сентября 2019

Похоже, вы захотите попробовать кластеризовать оранжевые точки. Некоторые методы кластеризации справляются с параллельными кластерами. Вероятно, я бы начал с DBSCAN .

Чтобы узнать больше о кластеризации, ознакомьтесь с руководством на этой странице scikit-learn . Ваша ситуация немного похожа на 4-ую строку:

enter image description here

Если вы предоставите ваши данные, я ожидаю, что на это посмотрят несколько человек.

...