Какой алгоритм позволит построить оптимальные «группы» терминов? - PullRequest
1 голос
/ 06 октября 2010

У меня есть таблица данных, и я хочу получить конкретные записи.Записи указаны различными случайными способами (как это не важно), но я хочу иметь возможность идентифицировать их, используя 11 конкретных терминов.По сути, мне задают множество запросов к неиндексированным полям, и мне приходится переписывать их с использованием определенных индексированных полей - за исключением того, что благодаря системе Enterprisey это не так просто: данные должны быть упакованы определенным образомэто позволяет избежать прямого прикосновения к SQL.

Может быть проще привести пример в 2-х измерениях, хотя сама проблема использует 11, который, вероятно, изменится:

  123
 +---+
A|X O|
B| X |
C|X O|
 +---+

Если я хочу сгруппировать все X в приведенном вышеСетка, я мог бы сказать: А1 и В2 и С1 .Лучше было бы (A, C) 1 и B2 .Еще лучше было бы (A, B, C) (1,2) - пустые места могут быть включены или исключены для этой проблемы, они не имеют значения.Что важно, так это уменьшить количество групп, получить все X и избегать всех Os.

Чтобы дать подсказку о размере, реальная проблема, как правило, будет иметь место между 100 и 5000 «хорошими» записями.Также не обязательно иметь идеальный ответ - достаточно хорошего ответа.

1 Ответ

2 голосов
/ 06 октября 2010

Это очень похоже на карты Карно , где X = true, 0 = false и пусто = "все равно".

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...