Как преобразовать Pandas поезд и целевые столбцы Dataframe в массив массивов с различными временными шагами для ввода LSTM? - PullRequest
0 голосов
/ 13 апреля 2020

введите описание изображения здесь

Как вы можете видеть, есть несколько «Cust_id», каждый из которых имеет различные временные шаги, есть целевой столбец (0/1) и является классификацией проблема с использованием LSTM.

Если первый Cust_id имеет 3 временных шага, а следующий Cust-id имеет 7, как мне преобразовать этот pandas фрейм данных в массив массивов, содержащих входные данные различной длины (для разных временных шагов) , можете ли вы предоставить код python для того же самого.

Архитектура LSTM - это «многие к одному», где в последовательности есть последовательности различной длины и один выходной сигнал в целевом объекте. Но так как у меня есть pandas, у поезда данных есть, например: [[["wewq", "2321321," 12123, "524243"], ["wewq", "423213", 3321 "," 23233 "], [ "wewq", "555512", "4333", "5"]]] НО цель имеет [0,0,1], я хочу, чтобы она была такой: [[["wewq", "2321321," 12123, "524243 "], [" wewq "," 423213 ", 3321", "23233"], ["wewq", "555512", "4333", "5"]]] и целью является 1 , то есть 3 последовательности приводят к 1 целевому значению.

Как этого можно достичь с помощью Python? Кроме того, как изменить данные для нейронных. Мои тренировочные данные имеют форму (79257, 25), 25-й столбец - целевой столбец. Это pandas фрейм данных.

...