Я работаю со значениями данных, поступающими от датчиков. Эти данные чрезвычайно велики. Если я хочу работать с фреймом данных, мне нужно работать с большим числом столбцов, чем 250000. Эти данные являются 10% числовыми и 90% категоричными. Я хочу преобразовать данные в числовые с помощью OneHotencoder, а затем извлечь будущее с использованием PCA для применения алгоритма машинного обучения: kmeans. Основная проблема здесь в том, что размер такой большой.
Любое предложение, пожалуйста