Я пишу свое первое основанное на видении приложение для глубокого подкрепления. Я хочу, чтобы это было вне политики, поэтому мне нужно сохранить большое количество данных исследования и , чтобы была возможность случайной выборки из сохраненных данных. Мое состояние и переход выглядели бы примерно так: все значения были бы целочисленными или плавающими, кроме состояния, включающего изображение.
state = (joint_angle, joint_position, camera_image)
Transition = namedtuple('Transition',
('state', 'action', 'next_state', 'reward'))
Для сохранения и загрузки я искал hdf5
и pickle
, но мне кажется, что я заново изобретаю колесо с моим кодом, и это тоже не красиво. Весь код, который я видел на github до сих пор, был очень хакерским. Может ли кто-нибудь указать мне направление некоторых примеров аккуратного кода / передовых методов сохранения и загрузки комбинации изображений и данных типа int / float таким образом, чтобы можно было эффективно сэмплировать?