Гипотетический пример, чтобы попытаться лучше объяснить мой вопрос.Скажем, у меня есть тысячи домов и двоичный результат для каждого, в данном случае, был ли дом куплен по крайней мере по первоначальной запрашиваемой цене.Затем у меня есть несколько переменных для каждого дома, например, местоположение, цвет дома, квадратные метры, тип крыши.По большей части, нечисловые категории.Для примера таблицы ниже:
.
Есть ли функция или какое-то чтение, на которое я мог бы быть направлен, чтобы помочь мне выяснить, есть ликакие-либо закономерности в этих данных с точки зрения того, какие комбинации переменных дают результат да (или нет)?
Например, даже в 15000 строках данных я могу быстро увидеть в Excel, сколько «Y» существует для данного округа или для всего округа.Но я не могу прокрутить все возможные комбинации, например, округ А, белые дома с крышей типа А против округа Б, красные дома с крышей типа С и т. Д.
Конечный продукт, который я хотел бы получить,возможность делать выводы, такие как «здесь комбинации переменных, которые чаще всего приводят к Да, и здесь комбинации переменных, которые чаще всего приводят к Нет».«Вот переменные, которые имеют / не имеют значения».