Deep Feature Synthesis создает новые функции, «укладывая» существующие функции.Чтобы понять эту функцию, давайте посмотрим, как это вычисляется шаг за шагом.
- Рассчитать функцию
MEAN(child.num_feature)
и добавить ее к parent2
. - Присоединиться к этой функции (определено в
parent2
) в child
.Это создает новую функцию parent2.MEAN(child.num_feature)
, определенную для child
.Строки child
, которые имеют одинаковое значение для `parent2 ', будут иметь одинаковое значение для этой функции. - Сгруппировать
child
по parent
и взять среднее значение этой функции.Это создает MEAN(child.parent2.MEAN(child.num_feature))
Чтобы прояснить ситуацию, давайте рассмотрим конкретный пример
Представьте себе, parent1
- таблица клиентов, child
- таблица transactions
вашими клиентами с колонкой amount
, а parent2
- это таблица каждого уникального продукта, который вы продаете.
Функция MEAN(transactions.product.SUM(amount))
, созданная для сущности клиента, может быть интерпретирована как «каков средний итог»продажа продуктов, купленных этим клиентом », например,« покупает ли этот клиент продукты, которые много проданы ».