На мой вопрос частично ответили здесь или здесь . Но эти ответы не выполнили весь мой вопрос.
- Я работаю над данными временных рядов. Допустим, я работаю с 3 функциями (A, B и C).
- Каждый пример состоит из временного интервала (ie: 1 час) и может не иметь ни одного, или нескольких объектов () ie: [A, B]; [B]; [A, B, C]).
- Элементы A и B имеют фиксированную длину (например, одно десятичное значение).
- Функция C имеет несколько значений, два десятичных значения и два (переменной длины) массива десятичных значений.
- Каждый выход (для прогнозирования значения) представляет собой одно десятичное значение.
Я хотел бы работать с RNN, и им нужен постоянный / фиксированный размер ввода (в DL4J).
Я предполагаю, что я могу использовать функцию маскирования для моей первой проблемы и функции маски если они отсутствуют в примере для каждого примера (то есть: [A, C] -> mask [1, 0, 1]). Это правда?
Но я до сих пор не знаю, как мне справиться с тем фактом, что функция (C в моем примере) может иметь массивы переменной длины с десятичными значениями. Я понял, что заполнение может быть решением, но знание того, каков максимальный размер этого массива, может быть дорогим, и я не уверен насчет максимальной длины в будущем. Может ли заполнение также привести мою сеть к неправильному обучению?
Для синтеза выборки данных с 12:00 до 15:00: