Как отформатировать / построить данные для прогнозирования таймсерий с использованием Python и Pandas? - PullRequest
0 голосов
/ 08 мая 2020
• 1000

Мы видим, что модель предсказывает следующее значение в последовательности.

[[102.09213]]

Но у меня есть данные о статьях, прочитанных с разных идентификаторов пользователей в течение 2019 года. А пока давайте рассмотрим одного пользователя или забыли о пользователе. мы будем рассматривать простые данные как ArticleID, прочитанные для любых дат, как показано ниже:

Мои данные:

from datetime import date, timedelta
import pandas as pd
import numpy as np
sdate = date(2019,1,1)   # start date
edate = date(2019,1,7)   # end date
required_dates = pd.date_range(sdate,edate-timedelta(days=1),freq='d')
# initialize list of lists 
data = [['2019-01-01', 1001], ['2019-01-03', 1121] ,['2019-01-02', 1500], 
        ['2019-01-02', 1400],['2019-01-04', 1501],['2019-01-01', 1200],
        ['2019-01-04', 1201],['2019-01-04', 1551],['2019-01-05', 1400]]
# Create the pandas DataFrame 
df1 = pd.DataFrame(data, columns = ['OnlyDate', 'ArticleID']) 
df1.sort_values(by='OnlyDate',inplace=True)
df = pd.get_dummies(df1.set_index('OnlyDate')['ArticleID']).max(level=0) 
df
                1001    1121    1200    1201    1400    1500    1501    1551
    2019-01-01   1       0       1       0       0       0       0       0
    2019-01-02   0       0       0       0       1       1       0       0
    2019-01-03   0       1       0       0       0       0       0       0
    2019-01-04   0       0       0       1       0       0       1       1
    2019-01-05   0       0       0       0       1       0       0       0
    2019-01-06   0       0       0       0       0       0       0       0

Я не могу преобразовать указанные выше данные, чтобы сделать он подходит для указанной выше модели LSTM.

Моя основная цель здесь - получить прогнозы для любого интереса пользователя (1) для любых предоставленных дат, поскольку я почти исправил 2200 идентификаторов статей и почти 500 идентификаторов пользователей.

Что я могу попробовать дальше?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...