Я пытаюсь решить проблему классификации нескольких классов с 11 классами, используя около 1,5 миллионов данных. одной из особенностей является наличие набора из 3000 различных объектов. Я хочу использовать эту функцию для обучения моего NN. Я решил использовать LabelBinarizer () для вышеупомянутой функции, но из-за большого размера я получаю ошибку памяти. Как я могу решить ошибку памяти? или я должен использовать другой подход? какой должен быть подход?
Я пытался создать свой собственный бинаризатор, который проходит через каждую строку и добавляет результат в массив, но, к сожалению, столкнулся с аналогичной проблемой, ядро умирает после прохождения определенного количества точек данных (650 000). Я попробовал LabelEncoding (), но это не дает удовлетворительного результата.