Мы знаем, что существуют алгоритмы, позволяющие уменьшить размерность наборов данных, таких как PCA и Isomap
- Каков уровень техники в уменьшении размерности для наборов данных.
- Doу вас есть пример, может быть, на MATLAB?
Допустим, у нас есть набор данных с 100 000 атрибутов, таких как Набор данных Dorothea (Химические соединения, представленные структурными молекулярными признаками, должны быть классифицированы какактивный (связывание с тромбином) или неактивный. Это один из 5 наборов данных задачи выбора функции NIPS 2003.)
Data Set Characteristics: Multivariate
Number of Instances: 1950
Area: Life
Attribute Characteristics: Integer
Number of Attributes: 100000
Date Donated 2008-02-29
Associated Tasks: Classification
Missing Values? N/A
Number of Web Hits: 17103