Список объектов группы / кластера на основе нескольких отдельных атрибутов - PullRequest
0 голосов
/ 02 декабря 2010

У меня есть список объектов с атрибутами, такими как цвет, длина, ширина и, что важно, цена. В конечном итоге я пытаюсь разделить список на самые большие подмножества, чтобы каждый член подмножества имел одинаковую цену и каждая перестановка цвета, длины, ширины присутствовала в подмножестве.

Другими словами, я хочу иметь возможность разделить набор элементов для обнаружения подмножеств, чтобы каждый набор можно было описать так:

  • все объекты красного, синего или зеленого цвета, длиной 10 или 11 дюймов, а также 4 дюйма, стоят $ 5
  • Все объекты красного или зеленого цвета, длиной 12 дюймов и высотой 4 дюйма стоят $ 6
  • Синий объект 12X4 стоит 6,50 * 1010 $
  • и т.д.. и т.д.

с целью подмножества содержать как можно больше элементов.

Я некоторое время боролся с этой проблемой, и я думаю, что ответ (или близкое приближение) может быть из методов кластеризации. Тем не менее, мне было трудно придумать матрицу расстояний, которая обеспечит результаты, которые я ищу. Кто-нибудь знает, как решить эту проблему.

Лучшее объяснение

Учитывая список объектов, аналогичных приведенным выше, сгруппируйте их в наименьшее количество полных подмножеств по цене.

1 Ответ

0 голосов
/ 02 декабря 2010

Ну, первый шаг - разделить все это по цене.

Оттуда звучит так, будто вы хотите получить образец полноты по другим признакам, а не кластеризацию. Если вы хотите "каждую перестановку цвета и т. Д." это не кластеризация, во всех отношениях, которые я понимаю! Это звучит как анти-кластеризация!

В любом случае, я нахожу ваше описание вашей конечной цели довольно запутанным.

...