Я читал статью Грина, Церона, Шумахера и Фазекаса, которая называла «Гайки и болты автоматического анализа текста: сравнение различных методов предварительной обработки документов в FourCountries».
В этой статье авторыутверждают, что использование стволовых и стоп-слов по отдельности уменьшает стандартные ошибки масштабирования оценок (по сравнению с необработанными текстами).Но при использовании их комбинации это увеличивает ее.
Так что вы можете мне помочь, почему при использовании этих техник по отдельности это увеличивает точность при использовании комбинации, когда SE повышается.
Спасибо взаранее, J