Могу ли я разложить матрицу на компонент меньшего размера? - PullRequest
0 голосов
/ 20 сентября 2019

У меня есть матрица с различными размерами.Например, один может иметь размерность 4*300, а другие могут иметь размерность 2*300.Матрицы формируются путем сложения векторного представления слов.Скажем, например, dog and cat - это фраза, а результирующая матрица будет 3 * 300, так как есть 3 tokens.Я использую spacy, чтобы получить вектор для каждого токена.Теперь я хочу получить конечные n компонентов путем разложения матрицы с использованием TSNE или PCA.Но нет прямого способа сделать это.TSNE и PCA рассматривают n_samples * n_features все время как входные данные, в то время как я хочу, чтобы это было только для одного входа с n*300 измерением.Я не могу сложить другие точки данных для формирования n_samples * n_features, поскольку каждая точка данных имеет свое собственное представление, которое я хочу в маленьком измерении.Как это можно сделать?

...