Скажем, я хочу создать двоичный классификатор для обнаружения спам-сообщений.У меня есть миллиард обучающих примеров и около 20 функций.Я хочу, чтобы мой обученный классификатор поместился в памяти (я буду запускать его на облачных и дисковых операциях, которые на самом деле являются вызовами rpc, будут стоить очень ).
Мой вопрос: как я могуоцените объем памяти, который мне понадобится для этого?Скажем, мой классификатор - «Случайный лес», и я ничего не знаю о распространении спам-сообщений в моем учебном наборе.
Только цифры: два класса, миллиард примеров, 20 функций.
Возможна ли такая оценка вообще?Как это можно сделать?