Я новичок в машинном обучении, и у меня одна из первых проблем с машинным обучением. Я сам много исследовал, но не смог найти решение этого вопроса.
Я создаю новые переменные из моего набора данных в Bigquery. Одна из переменных состоит в подсчете переменной (x), если выполняется условие в переменной (y). Я не могу использовать WHERE или HAVING, поскольку условие связано только с вычислением этой конкретной переменной.
Код более или менее похож на этот:
COUNT(DISTINCT sessionid IF(date > “2018-06-01” && date < “2018-06-30”))
AS sessions_lastmonth
Я знаю, что этот код неправильный и не может быть, но это просто способ выразить более или менее то, что мне нужно.
Цель состоит в том, чтобы узнать количество сеансов за определенный период. Я не могу использовать счетчик для даты, потому что в один день вы можете иметь более одного сеанса, и не каждый ряд - это другой сеанс (сеанс может иметь несколько строк, потому что пользователь может просматривать много страниц в одном сеансе).
Спасибо!