Эффективный доступ к произвольным пакетам NDArray в mxnet - PullRequest
0 голосов
/ 17 октября 2018

Подгонка коннететов, таких как Resnet и VGG, использует класс Python ImageRecordIter, который позволяет эффективно загружать пакеты из больших коллекций изображений RGB, хранящихся в файлах RecordIO .rec,

Кто-нибудь знает об эквивалентных средствах для больших произвольныхвходные 2D или 3D матрицы (для 2D, строки = элементы и столбцы = объекты, + каналы в 3D)?

NDArrayIter требует загрузки всего набора данных в память, чего в моем случае следует избегать (данные объемом более 40 ГБ)файл).CSVIter не допускает прямого тасования и работает только для 2D матриц.

1 Ответ

0 голосов
/ 25 октября 2018

Вы можете хранить каждый образец данных в отдельном файле и реализовать очень простой пользовательский класс DataSet, следуя ссылочному коду ImageFolderDataset

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...