Я работаю с набором данных, который выглядит примерно так:
PERSON1 = [["Person1Id", "Rome", "Frequent Flyer", "1/2/2018"],["Person1Id", "London", "Frequent Flyer", "3/4/2018"],["Person1Id", "Paris", "Frequent Flyer", "2/4/2018"], ...]
PERSON2 = [["Person2Id", "Shenzen", "Frequent Flyer", "1/2/2018"],["Person2Id", "London", "Frequent Flyer", "2/6/2018"],["Person2Id", "Hong Kong", "Not Frequent Flyer", "1/3/2017"], ...]
PERSON3 = [["Person3Id", "Moscow", "Frequent Flyer", "1/2/2018"],["Person3Id", "London", "Frequent Flyer", "3/4/2018"],["Person3Id", "Paris", "Frequent Flyer", "2/4/2018"], ...]
...
TRAIN_X = [
PERSON1, PERSON2, PERSON3, ..., PERSONN
]
TRAIN_Y = [
1, 0, 1, ..., 1
]
Идея состоит в том, что некоторые люди относятся к классу 1
, а некоторые к классу 0
, в зависимости от данных обучения.(Фактические используемые массивы данных длиннее, это упрощенная версия.)
Мой вопрос - учитывая эту структуру данных - как я могу правильно загрузить ее в Tensorflow для обучения нейронной сети?Я работал с более простыми наборами данных, такими как набор данных Iris, MNIST и т. Д. Я понятия не имею, как обращаться с более сложными, реальными данными, подобными этим, и я не могу найти какую-либо документацию / ресурсы / образец кода, которыйделает что-нибудь подобное.
Я предполагаю, что первым шагом здесь является то, что данные должны быть сведены, нормализованы и т. Д. - каким-то образом, однако я не уверен, как поступить.