Как я должен построить свой набор данных tenorflow для подачи его в пользовательский оценщик RNN - PullRequest
0 голосов
/ 30 ноября 2018

Я пытаюсь использовать пользовательский оценщик RNN для оценки того, собирается ли клиент на моем веб-сайте покупать товар на основе его поведения при нажатии.Таким образом, набор данных выглядит следующим образом:

session_id  page_type   event            since_previous_click (s)   will_buy
1           search      SelectCountry    null                        0
1           search      SelectCountry    2                           0
1           search      SortResults      4                           0
1           product     SelectColor      20                          0
2           search      SelectCountry    null                        1
2           search      SortResults      10                          1
2           product     SelectSize       5                           1
2           product     SelectColor      23                          1
2           inmarket    EnterName        8                           1
2           inmarket    Booked           34                          1

Таким образом, "will_buy" является меткой, а page_type, event и since_previous_click являются входными функциями.Однако моя проблема в том, что я не знаю, как структурировать мой входной набор данных .Я знаю, что измерения должны быть [#data points, #time steps, #features], где число временных шагов должно быть дополнено, так как они не имеют одинаковую длину.Но я не могу построить этот трехмерный объект из тензора (или массива с нулевыми значениями), так как есть несколько dtypes (string и int32).Любая помощь?

1 Ответ

0 голосов
/ 30 ноября 2018

Преобразование типа страницы и события в один горячий вектор.Тогда все ваши данные будут int32.

...