Я хочу обучить свою регрессионную модель, используя sklearn со следующими данными, и использовать ее для прогнозирования дохода, заданного другими параметрами:
![enter image description here](https://i.stack.imgur.com/UCIcu.png)
Но я столкнулся с некоторой проблемой, когда пытался уместить свою модель.
from sklearn import linear_model
model = linear_model.LinearRegression()
train_x = np.array([
[['Tom','Adam'], '005', 50],
[['Tom'], '001', 100],
[['Tom', 'Adam', 'Alex'], '001', 150]
])
train_y = np.array([
50,
80,
90
])
model.fit(train_x,train_y)
>>> ValueError: setting an array element with a sequence.
Я провел некоторый поиск, проблема заключалась в том, что train_x не имел одинаковое количество элементов во всех массивах (staff_id). И я думаю, что, возможно, мне следует добавить некоторые дополнительные элементы в некоторые массивы, чтобы согласовать длину. Но я понятия не имею, как именно сделать этот шаг. Это называется "векторизация"?