Как создать модель машинного обучения с функцией One Multi Value - PullRequest
0 голосов
/ 13 июля 2020

Я хотел бы обучить модель машинного обучения с несколькими функциями на входе как X [] и с одним выходом как Y. Например, у каждого образца есть такой фрейм данных: X[0], X[1], X[2], X[3], X[4], Y

Скажем Один образец, следующие данные - это только одно значение: X[0], X[1], X[2], X[4], Y Это обычная проблема машинного обучения.

Но теперь, если я хочу установить несколько значений X [3], например, образец 1 Данные:

X[0] | X[1] | X[2] |         X[3]         | X[4] | Y
 10  |  5   |   6  | [10, 20, 30, 40, 50] |  7   | 90

Данные в примере 2:

X[0] | X[1] | X[2] |         X[3]         | X[4] | Y
 11  |  7   |   5  | [20, 30, 40, 50, 60] |  3   | 80

Можно ли следовать обычному процессу машинного обучения и получить модель, которая могла бы рассчитать образец с другим примером с такими данными, как:

X[0]   | X[1] |  X[2]  |         X[3]         | X[4] | Y
 10.5  |  6   |   5.5  | [15, 25, 35, 45, 55] |  5   | ???

Если длина каждого X [3] невелика, можно разделить X [3] на несколько новых функций, но если длина X [3] очень велика (len> 1000) с другим распределением, создание двоичного файла также приводит к появлению слишком большого количества новых функций. Есть ли способ обработать X [3] напрямую, не добавляя новых функций?

Ответы [ 2 ]

0 голосов
/ 14 июля 2020

Решение во многом зависит от задачи, которую вы преследуете.

Основные подходы:

  • преобразование X3 в одно значение (используйте mean, median, sum) или несколько функций (min, max, stdev, quantiles),
  • PCA или другой алгоритм уменьшения размеров для уменьшения размера внутри,
  • для бесплатных текстовых функций используйте методы embedding.

Примечание : я бы рекомендовал сначала проверить, выкидываете ли вы важные данные, заменив вектор X3 одним значением.

0 голосов
/ 14 июля 2020

Просто попробуйте взять среднее или медиану X [3] и заменить X [3] его средним или медианой. Затем обучите обычную модель машинного обучения, используя обновленные данные.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...