Ошибка памяти при бинаризации столбца в кадре данных - PullRequest
0 голосов
/ 18 июня 2019

Я пытаюсь решить проблему классификации нескольких классов с 11 классами, используя около 1,5 миллионов данных. одной из особенностей является наличие набора из 3000 различных объектов. Я хочу использовать эту функцию для обучения моего NN. Я решил использовать LabelBinarizer () для вышеупомянутой функции, но из-за большого размера я получаю ошибку памяти. Как я могу решить ошибку памяти? или я должен использовать другой подход? какой должен быть подход?

Я пытался создать свой собственный бинаризатор, который проходит через каждую строку и добавляет результат в массив, но, к сожалению, столкнулся с аналогичной проблемой, ядро ​​умирает после прохождения определенного количества точек данных (650 000). Я попробовал LabelEncoding (), но это не дает удовлетворительного результата.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...