У меня есть матрица с различными размерами.Например, один может иметь размерность 4*300
, а другие могут иметь размерность 2*300
.Матрицы формируются путем сложения векторного представления слов.Скажем, например, dog and cat
- это фраза, а результирующая матрица будет 3 * 300
, так как есть 3 tokens
.Я использую spacy, чтобы получить вектор для каждого токена.Теперь я хочу получить конечные n компонентов путем разложения матрицы с использованием TSNE или PCA.Но нет прямого способа сделать это.TSNE и PCA рассматривают n_samples * n_features
все время как входные данные, в то время как я хочу, чтобы это было только для одного входа с n*300
измерением.Я не могу сложить другие точки данных для формирования n_samples * n_features
, поскольку каждая точка данных имеет свое собственное представление, которое я хочу в маленьком измерении.Как это можно сделать?