Классификация новостей Основана на встраивании персонажей с использованием Двунаправленного ГРУ с вниманием - PullRequest
0 голосов
/ 13 апреля 2019

У меня довольно маленький (около 10000) корпус спортивных новостных статей, и я пытаюсь классифицировать новостные статьи по подкатегориям, например статьи о крикете, статьи о футболе и т. Д.

Я пытаюсь достичьхорошая точность, чем стандартные базовые методы (LSTM с CRF, двунаправленный LSTM).Я думал о реализации двунаправленного LSTM или GRU с вниманием, основанным на встраивании на уровне персонажа на основе (https://www.sciencedirect.com/science/article/pii/S0925231219301067)

. Как вы думаете, это правильное направление для продвижения вперед? Во время исследования я прочитал, что встраивание на уровне персонажа работает лучшечем встраивание на уровне слов в зависимости от набора данных (https://forums.fast.ai/t/when-are-character-embeddings-better-than-word-embeddings-and-vice-versa/3551/3)

Применимо ли это и к области новостной статьи? Возможно, мне придется провести эксперимент самостоятельно, но перед тем, как перейти к нему, мне понадобился совет.

...