Я оцениваю гауссовский двумерный KDE данных о позициях (координаты x и y), и для этого я использую sns.kdeplot
. Хотя он работает правильно (т.е. я получаю график, который я получаю), он довольно медленный для объема данных, которые у меня есть (может быть до 0,5 миллиона (x, y) пар).
Что такое сложность kdeplot
, реализованная в seaborn
? Я не могу найти эту информацию. Является ли это «классической» сложностью $ O (nm) $ KDE?
Есть ли свободно доступные реализации графиков KDE, которые быстрее, чем в seaborn
?
Существуют ли какие-либо методы предварительной обработки данных о местоположении, которые могут ускорить вычисления? Я прочитал ответы на https://stats.stackexchange.com/questions/105623/how-to-speed-up-kernel-density-estimation,, но не до конца понял, и не уверен, применимо ли это непосредственно к моему типу данных. Из ответов на эти вопросы, какой будет предпочтительным методом для данных о местах? Являются ли деревья кД хорошим подходом к этому? Это уже реализовано в seaborn
(или в другой библиотеке), или я должен написать свою собственную реализацию?