Для каждого числового объекта статистически есть представление (вы можете использовать pandas.DataFrame.describe), а также построение графика распределения сделает вас сильнее.
После получения значений среднего, стандартного, максимального, минимального и т. Д. Вы должны избавиться от выбросов, которые могут повредить вашей модели обучения.Например, если ваши объекты имеют свои 90% числовых значений от 18 до 72, но также имеют значения, такие как 1,1 или 1200 и т. Д., Вы должны избавиться от них, выровняв их до 18 или 72 в зависимости от стороны.Вы можете использовать np.clip ()
После разумного распространения вы должны преобразовать эти числовые функции в категориальные.Например, числовое распределение от 18 до 72 может быть сгруппировано как 18, 27, 36, ......, 72, принимая интервалы.Вы можете увеличить разрешение или уменьшить его, в зависимости от вашего понимания и производительности алгоритма.Вы можете использовать np.digitize () или сделать это вручную с помощью простой функции, которую вы можете написать.
В конце концов, у вас есть категорическая особенность, как тексты.CNN или RNN могут отлично работать с категориальными представлениями числовых значений, а также вы получите лучшее преимущество, если использовать функциональные перекрестки для повышения производительности.
Но если вы попросите что-нибудь более сложное, я, возможно, не понял вашего вопроса, или, возможно, я не знаю этого.Тем не менее, если вы хотите спросить больше или иначе, я буду рад попытаться помочь.