Инженерия функций в электронной коммерции Веб-аналитика - PullRequest
0 голосов
/ 25 декабря 2018

Я очень новичок в этом форуме и задаю вопрос впервые.Я работаю над набором данных электронной коммерции для проекта, который включает эти две переменные - посещенную страницу (0/1) и выходы (num var со значениями -1,0,2,3 ......), которые указывают количествораз уникальный идентификатор покинул конкретную страницу.Есть 6 таких страниц с информацией.

Выходы -1 на странице - это те, которые не посещаются.Однако я использую выходы страницы для вычисления других показателей, таких как скорость выхода, и я не уверен, как удалить / заменить -1 без потери информации или выразить ее другим способом.Я не могу сделать это 0 - bcos, что означало бы, что на странице не осталось выхода / vistor.Даже если я удаляю и создаю категориальную переменную, которая указывает «Нет посещения, остался, вышел».

Как мне это сделать ... нужно ли мне здесь разрабатывать какие-либо функции?

1 Ответ

0 голосов
/ 25 декабря 2018

Создайте функцию, которая представляет, если пользователь никогда не посещал страницу в виде двоичного файла 1/0, а затем просто имеет столбец из 0 - n для количества выходов (если выход равен -1, то 1, иначе 0).После создания дополнительного столбца я бы установил выходы от -1 до 0.

Однако , я думаю, вам нужно учитывать значение -1 больше (или предоставить дополнительную информацию),люди все еще находятся на странице, когда ваш предполагаемый алгоритм будет работать?Существуют ли ваши данные для нескольких страниц, а -1 означает, что они никогда не посещали эту страницу?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...