Классификация текста на небольшом несбалансированном наборе данных: использование внешних элементов - PullRequest
0 голосов
/ 15 марта 2020

Классификация текста по небольшому несбалансированному набору данных текстовых документов (N = 479; метка 1: N = 404, метка 2: N = 44 метка 3: N = 31) 3-я метка содержит заговорщические документы.

Поскольку у меня так мало примеров (по отношению к общему набору данных + в целом), мне было интересно, будет ли это вариант использования внешних функций, возможно, путем создания / извлечения TF / IDF терминов заговора. И вообще, если использование функций, полученных из внешних источников, является допустимым методом в исследованиях ML & Text Mining.

...