Question

Я оцениваю гауссовский двумерный KDE данных о позициях (координаты x и y), и для этого я использую sns.kdeplot. Хотя он работает правильно (т.е. я получаю график, который я получаю), он довольно медленный для объема данных, которые у меня есть (может быть до 0,5 миллиона (x, y) пар).

Что такое сложность kdeplot, реализованная в seaborn? Я не могу найти эту информацию. Является ли это «классической» сложностью $ O (nm) $ KDE?
Есть ли свободно доступные реализации графиков KDE, которые быстрее, чем в seaborn?
Существуют ли какие-либо методы предварительной обработки данных о местоположении, которые могут ускорить вычисления? Я прочитал ответы на https://stats.stackexchange.com/questions/105623/how-to-speed-up-kernel-density-estimation,, но не до конца понял, и не уверен, применимо ли это непосредственно к моему типу данных. Из ответов на эти вопросы, какой будет предпочтительным методом для данных о местах? Являются ли деревья кД хорошим подходом к этому? Это уже реализовано в seaborn (или в другой библиотеке), или я должен написать свою собственную реализацию?

Seaborn Bivariate KDE ускорение

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Seaborn Bivariate KDE ускорение

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов