Вы можете использовать прямой выбор функций, который начинается с одной функции, вы обучаете модель только одной из 300 функций и делаете это 300 раз, чтобы вы обучили модель каждой из них отдельно и выберите ту, которая дала вашу модель.Наивысшая точность, теперь сохраните эту и начните тренировать вашу модель с выбранной функцией, а другую - из 299 оставшихся, так что вы тренируете модель 299 с двумя характеристиками, теперь добавьте одну из 299, которая дала вам наивысшую точность, сопровождающую ранеевыбрал один.Теперь у вас есть 2 функции.Вы продолжаете в том же духе, чтобы выбрать k лучших функций, которые вы хотите, например, 100.имейте в виду, что этот метод не даст вам оптимальный набор функций, например, две функции могут работать очень хорошо вместе, но ни одна из них не оказывает существенного влияния только на границу принятия решения, поэтому ни одна из них не будет выбрана. Также это мучительно долгоподход.есть также обратный выбор объектов, который вы запускаете, все из них, все 300, и удаляете один за другим менее значимую базу функций, связанную с ошибкой, которую вы получаете, удаляя их.
мой совет - использовать методы извлечения функцийвместо.используйте PCA от scikit-learn.это так просто, как просто импортировать и вызвать его!сделанный.но перед использованием PCA обязательно нормализуйте свои данные, в этом случае вы можете использовать StandardScalar .