Может кто-нибудь объяснить мне, как классификатор обучается и, наконец, прогнозируется? Я имею в виду последние две строки кода ниже. Я не могу понять, как это работает.
Я пишу тезис о ML и классификации текста, и это последняя из моих проблем.
Мой ответ на этот вопрос: В этом пункте классификатортренировка. Это первый шаг к созданию модели ответов. Мы берем образцы и присваиваем им ярлыки.
Это правда?
$split = new StratifiedRandomSplit($dataset, 0.2, 42);
$pipeline = new Pipeline([
new TokenCountVectorizer($tokenizer = new NGramTokenizer(1, 3), new Polish()),
new TfIdfTransformer()
], new SVC());
$pipeline->train($split->getTrainSamples(), $split->getTrainLabels());
$predicted = $pipeline->predict($split->getTestSamples());