Создайте пользовательский объединенный набор данных в TensorFlow Federated - PullRequest
4 голосов
/ 30 марта 2019

Я бы хотел адаптировать рекуррентный автоэнкодер из этого сообщения в блоге для работы в интегрированной среде.

Я немного изменил модель, чтобы соответствовать примеру, показанному в Учебник по классификации изображений TFF.

def create_compiled_keras_model():
  model = tf.keras.models.Sequential([
      tf.keras.layers.LSTM(2, input_shape=(10, 2), name='Encoder'),
      tf.keras.layers.RepeatVector(10, name='Latent'),
      tf.keras.layers.LSTM(2, return_sequences=True, name='Decoder')]
  )

  model.compile(loss='mse', optimizer='adam')
  return model

model = create_compiled_keras_model()

sample_batch = gen(1)
timesteps, input_dim = 10, 2

def model_fn():
  keras_model = create_compiled_keras_model()
  return tff.learning.from_compiled_keras_model(keras_model, sample_batch)

Функция gen определяется следующим образом:

import random

def gen(batch_size):
    seq_length = 10

    batch_x = []
    batch_y = []

    for _ in range(batch_size):
        rand = random.random() * 2 * np.pi

        sig1 = np.sin(np.linspace(0.0 * np.pi + rand, 3.0 * np.pi + rand, seq_length * 2))
        sig2 = np.cos(np.linspace(0.0 * np.pi + rand, 3.0 * np.pi + rand, seq_length * 2))

        x1 = sig1[:seq_length]
        y1 = sig1[seq_length:]
        x2 = sig2[:seq_length]
        y2 = sig2[seq_length:]

        x_ = np.array([x1, x2])
        y_ = np.array([y1, y2])
        x_, y_ = x_.T, y_.T

        batch_x.append(x_)
        batch_y.append(y_)

    batch_x = np.array(batch_x)
    batch_y = np.array(batch_y)

    return batch_x, batch_x #batch_y

До сих пор я не смог найти никакой документации, которая быне использовать образцы данных из репозитория TFF.

Как я могу изменить это, чтобы создать объединенный набор данных и начать обучение?

1 Ответ

1 голос
/ 01 апреля 2019

На очень высоком уровне, чтобы использовать произвольный набор данных с TFF, необходимы следующие шаги:

  1. Разделение набора данных на для каждого клиента подмножеств (как это сделать - гораздо больший вопрос)
  2. Создать tf.data.Dataset для каждого подмножества клиента
  3. Передать список всех (или подмножество) объектов набора данных федеративной оптимизации.

Что происходит в учебнике

В учебнике Федеративное обучение по классификации изображений используется tff.learning.build_federated_averaging_process для создания федеративной оптимизации с использованием алгоритма FedAvg.

В этой записной книжке следующий код выполняет один раунд федеративной оптимизации, когда наборы данных клиента передаются процессу .next метод:

   state, metrics = iterative_process.next(state, federated_train_data)

Здесь federated_train_data - это Python list из tf.data.Dataset, по одному на каждого клиента, участвующего в раунде.

объект ClientData

Консервированные наборы данных, предоставленные TFF (под tff.simulation.datasets ), реализованы с использованием интерфейса tff.simulation.ClientData , который управляет сопоставлением клиентских → наборов данных и tff.data.Dataset создание.

Если вы планируете повторно использовать набор данных, его реализация в виде tff.simulation.ClientData может упростить использование в будущем.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...