Подготовка входных данных для LSTM в Keras / Tensorflow - PullRequest
1 голос
/ 09 июня 2019

Форма ввода слоя LSTM - (batch_size, timesteps, features). В настоящее время у меня есть вход, который выглядит так:

[0,1,2,3,4,5,6,7,8,9,10]

Я использую свой код для изменения формы данных, чтобы они выглядели так

[
[0,1,2,3],
[1,2,3,4],
[2,3,4,5],
[3,4,5,6],
[4,5,6,7],
[5,6,7,8],
[6,7,8,9],
[5,7,8,10]
]

Однако для изменения этих данных в Python требуется много времени. Есть ли какой-то способ для модели LSTM в Keras / Tensorflow изучать данные исключительно из [0,1,2,3,4,5,6,7,8,9,10] где я определяю временные шаги 4 в Keras API. Я пытался найти такой вариант, но не нашел.

Вот что я использовал:

numberOfTimesteps = 240
i = 0
lstmFeatures = pd.DataFrame()
while i < features.transpose().shape[0] - numberOfTimesteps:
    temp = features.transpose().iloc[i:i+numberOfTimesteps,:]
    lstmFeatures = lstmFeatures.append(temp)
    if i%100 == 0:
        print(i,end=',')
    i = i + 1        

Кто-нибудь имеет лучшее представление о том, как изменить форму или как использовать Keras?

1 Ответ

0 голосов
/ 09 июня 2019

Вы можете использовать tf.gather

import tensorflow as tf

my_data = tf.constant([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
to_take_inds = tf.range(4)[None, :]
to_take_inds = to_take_inds + tf.range(7)[:, None]

reshaped = tf.gather(my_data, to_take_inds)
with tf.Session() as sess:
    print(sess.run(reshaped))

отпечатки

[[ 1  2  3  4]
 [ 2  3  4  5]
 [ 3  4  5  6]
 [ 4  5  6  7]
 [ 5  6  7  8]
 [ 6  7  8  9]
 [ 7  8  9 10]]
...