Как работать с различными размерами и существованием функций (DL4J) - PullRequest
0 голосов
/ 04 мая 2020

На мой вопрос частично ответили здесь или здесь . Но эти ответы не выполнили весь мой вопрос.

  • Я работаю над данными временных рядов. Допустим, я работаю с 3 функциями (A, B и C).
  • Каждый пример состоит из временного интервала (ie: 1 час) и может не иметь ни одного, или нескольких объектов () ie: [A, B]; [B]; [A, B, C]).
  • Элементы A и B имеют фиксированную длину (например, одно десятичное значение).
  • Функция C имеет несколько значений, два десятичных значения и два (переменной длины) массива десятичных значений.
  • Каждый выход (для прогнозирования значения) представляет собой одно десятичное значение.

Я хотел бы работать с RNN, и им нужен постоянный / фиксированный размер ввода (в DL4J).
Я предполагаю, что я могу использовать функцию маскирования для моей первой проблемы и функции маски если они отсутствуют в примере для каждого примера (то есть: [A, C] -> mask [1, 0, 1]). Это правда?

Но я до сих пор не знаю, как мне справиться с тем фактом, что функция (C в моем примере) может иметь массивы переменной длины с десятичными значениями. Я понял, что заполнение может быть решением, но знание того, каков максимальный размер этого массива, может быть дорогим, и я не уверен насчет максимальной длины в будущем. Может ли заполнение также привести мою сеть к неправильному обучению?

Для синтеза выборки данных с 12:00 до 15:00: enter image description here

...