Почему косинусное сходство со встраиванием слов не дает хорошего результата ... Оно дает значения сходства нового документа с большинством исторических документов столь же высокими ... хотя оба документа не похожи
косинусное сходство показывает, как сходные два вектора основаны на угле между ними.
Как вы строите вложение документа? как word2ve c только даст вам вложение слов?
Большинство людей используют tf-idf в качестве метри c для ранжирования документов.