Seaborn Bivariate KDE ускорение - PullRequest
       3

Seaborn Bivariate KDE ускорение

1 голос
/ 03 ноября 2019

Я оцениваю гауссовский двумерный KDE данных о позициях (координаты x и y), и для этого я использую sns.kdeplot. Хотя он работает правильно (т.е. я получаю график, который я получаю), он довольно медленный для объема данных, которые у меня есть (может быть до 0,5 миллиона (x, y) пар).

  1. Что такое сложность kdeplot, реализованная в seaborn? Я не могу найти эту информацию. Является ли это «классической» сложностью $ O (nm) $ KDE?

  2. Есть ли свободно доступные реализации графиков KDE, которые быстрее, чем в seaborn?

  3. Существуют ли какие-либо методы предварительной обработки данных о местоположении, которые могут ускорить вычисления? Я прочитал ответы на https://stats.stackexchange.com/questions/105623/how-to-speed-up-kernel-density-estimation,, но не до конца понял, и не уверен, применимо ли это непосредственно к моему типу данных. Из ответов на эти вопросы, какой будет предпочтительным методом для данных о местах? Являются ли деревья кД хорошим подходом к этому? Это уже реализовано в seaborn (или в другой библиотеке), или я должен написать свою собственную реализацию?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...