Что это вообще означает SUM (sessions.MIN (Transactions.amount)) из официальной документации к комплекту инструментов? - PullRequest
0 голосов
/ 08 декабря 2018

Может ли кто-нибудь помочь мне с тем, как на самом деле будет работать такая функция, автоматически созданная Deep Feature Synthesis?Я сталкивался с таким количеством созданных функций, и я не уверен, как это работает.Я не могу подключить весь код здесь, хотя я уверен, что люди, которые читают официальный документ featuretools, знают об этом примере.Надеемся увидеть ответ!Спасибо за ваше время!

1 Ответ

0 голосов
/ 11 декабря 2018

Это функция, созданная для таблицы «клиенты».

Функция SUM(sessions.MIN(transactions.amount)) может интерпретироваться как сумма минимальной суммы транзакции для каждого сеанса для клиента.

Это рассчитывается как

  • Поиск всехсеансы для клиента
  • Расчет минимальной суммы транзакции для каждого сеанса
  • Суммирование этой минимальной суммы по всем сеансам для клиента

Featuretools использует Deep Feature Synthesis длястек примитивов, чтобы сделать более сложные функции.Таким образом, в этом случае он использовал примитив MIN и примитив SUM для создания объекта с глубиной 2. Эта глубина полезна, потому что вы получаете сложные шаблоны для машинного обучения.

Например,функцию MAX(sessions.SUM(transactions.amount)) можно интерпретировать как максимальную сумму, которую клиент потратил за все сеансы.

...