Я пытаюсь реализовать Extrofitting для встраивания слов на основе этой реализации https://github.com/HwiyeolJo/Extrofitting и этой статьи https://arxiv.org/pdf/1804.07946.pdf
В основном этот алгоритм использует линейный дискриминантный анализ для уменьшения размерности. Это хорошо работает, если я использую общие лексиконы, такие как ppdb-xl, framenet и wordnet. Выходное измерение - 300, которое является измерением вектора внедрения слова. Но когда я использую свой собственный предметно-ориентированный лексикон, мое выходное измерение уменьшается до 8. Кто-нибудь знает, как управлять выходным измерением? Я просто использую scikit-learn
для реализации LDA:
lda = LinearDiscriminantAnalysis(n_components=WordDim)
wordVec_np = lda.fit_transform(wordVec_np[:,:-1], wordVec_np[:,-1])
Спасибо!