Есть ли хорошая эвристика для группировки 2d-массива? - PullRequest
0 голосов
/ 14 июля 2020

У меня есть двумерный массив, который я хотел бы сгруппировать. Я мог бы сгруппировать его в интервалы с равным интервалом, но тогда у меня были бы некоторые интервалы только с одной точкой данных, а другие - с сотнями. Есть ли какие-нибудь хорошие эвристики группировки (специально для python), которые я могу использовать для создания бинов неравного размера, но содержащих примерно одинаковое количество точек данных?

Лучшим решением для меня были бы бины с минимальным и максимальное количество точек данных для включения, таким образом моя группировка остается гибкой. Однако я не знаю, с чего начать создание такой эвристики c.

Вот график двухмерных данных, которые я хотел бы сгруппировать: Мои данные РЕДАКТИРОВАТЬ: я хочу, чтобы бункеры группировки также были двухмерными

1 Ответ

1 голос
/ 14 июля 2020

Возможно, вы захотите ввести в Google array-partitioning (rectangular-partitioning), иногда workload-partitioning.

2d-случай уже может быть NP-трудным, но есть несколько хороших алгоритмов, которые кажутся быть очень важным в отношении разделения рабочих нагрузок в параллельных или распределенных системах.

Не python, но очень полная библиотека для этого: SPart - Spatially Located Workload Partitioner .

Ресурсы на этой странице могут содержать ссылки на дополнительные исследования в этой области.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...