Правильные параметры для обучения AWS Sagemaker с несколькими классами на изображение - PullRequest
0 голосов
/ 11 февраля 2019

Я обнаружил, что от «multi_label» до «1» для заданий классификации изображений они вылетают со следующей ошибкой:

Algorithm Error: Internal Server Error
[15:56:08] /opt/brazil-pkg-cache/packages/MXNetECL/MXNetECL-master.657.0/AL2012/generic-flavor/src/src/operator/custom/custom.cc:418: Check failed: reinterpret_cast<CustomOpFBFunc>(params.info->callbacks[kCustomOpBackward])( ptrs.size(), const_cast<void**>(ptrs.data()), const_cast<int*>(tags.data()), reinterpret_cast<const int*>(req.data()), static_cast<int>(ctx.is_train), params.info->contexts[kC
15:56:08 Stack trace returned 7 entries:
15:56:08 [bt] (0) /opt/amazon/lib/libaialgsdataiter.so(dmlc::StackTrace()+0x3d) [0x7f85e19f179d]
15:56:08 [bt] (1) /opt/amazon/lib/libaialgsdataiter.so(dmlc::LogMessageFatal::~LogMessageFatal()+0x1a) [0x7f85e19f1a3a] 
15:56:08 [bt] (2) /opt/amazon/lib/libmxnet.so(+0x26da8fd) [0x7f85d0edb8fd]
15:56:08 [bt] (3) /opt/amazon/lib/libmxnet.so(std::thread::_Impl<std::_Bind_simple<mxnet::op::custom::CustomOperator::CustomOperator()::{lambda()#1} ()> >::_M_run()+0x12f) [0x7f85d0ede0ef]
15:56:08 [bt] (4) /opt/amazon/lib/libstdc++.so.6(+0xce440) [0x7f85cc9ea440]
15:56:08 [bt] (5) /lib64/libpthread.so.0(+0x7dc5) [0x7f85e31e1dc5]
15:56:08 [bt] (6) /lib64/libc.so.6(clone+0x6d) [0x7f85e25de6ed]
15:56:08 Algorithm Error: Internal Server Error

Исходя из моего понимания документации, этот параметр должен позволить вам назначитьнесколько тегов для каждого изображения - есть ли хитрость, чтобы заставить его работать, или для отладки этих следов стека?(https://docs.aws.amazon.com/sagemaker/latest/dg/IC-Hyperparameter.html)

Ответы [ 2 ]

0 голосов
/ 28 февраля 2019

Можете ли вы проверить файл записи, который вы используете для обучения?Пожалуйста, следуйте этому примеру , чтобы узнать, как подготовить набор данных для обучения с несколькими метками

0 голосов
/ 11 февраля 2019

О, это ужасно ... Не могли бы вы поделиться кодом, который позволил бы нам воспроизвести ошибку?Полные журналы тоже были бы полезны.Рады получить билет поддержки от вашего имени.

Жюльен (AWS)

...