Самое важное - понять, что означает каждый вектор.В большинстве курсов они говорят о
h = theta'* x
Но здесь они используют векторы столбца, поэтому h является скаляром для одного примера обучения.Векторизованная нотация говорит вам
h = X * theta
Где X - это матрица всех ваших обучающих примеров, где каждый пример - строка, а функции - столбцы.Итак, mxn с m количеством обучающих примеров и n количеством функций.Вы хотите, чтобы h дал вывод для каждого примера обучения, поэтому вы хотите матрицу amx 1.Вы знаете, что тэта будет беспокоиться 1 матрица, так как это тета для каждой функции, и у вас есть 1 модель.Если вы выполните вторую формулу, которую я записал сверху, вы получите матрицу Hamx 1, которая является предпочтительной.