К сожалению, в общем случае вы не сможете однозначно проанализировать ваш набор данных. На данный момент игнорируем столбец действия, рассмотрим следующие два набора данных:
Набор данных 1:
A B C
1 1 1
1 1 0
0 1 1
1 0 1
1 0 0
1 0 0
0 1 0
0 1 0
0 0 1
0 0 1
Набор данных 2:
A B C
1 1 0
1 1 0
1 0 1
1 0 1
0 1 1
0 1 1
1 0 0
0 1 0
0 0 1
Если я не ошибаюсь, эти два набора данных будут показывать одинаковое количество пользователей в каждой паре характеристик:
A A 5
A B 2
A C 2
B B 5
B C 2
C C 5
Теперь у вас может возникнуть искушение подумать: «Эй, в первом наборе данных 10 пользователей, а во втором - только 9. Если я смогу получить общее количество пользователей, решит ли это мою проблему? " Ответ в основном нет. Если у вас три или меньше характеристик, тогда ответ положительный (см .: Принцип исключения-включения ). Однако, если у вас более трех характеристик, ответ будет отрицательным. Вы можете построить аналогично неоднозначные примеры, где общее количество пользователей одинаково.