Много раз я читал, что с однослойным персептроном вы можете изучать только линейные функции. Но что, если мы используем обобщенную линейную модель?
Представьте, что у нас есть только одна входная функция x1
. Функция, которую изучит SLP, будет иметь форму:
y = w0 + w1*x1
Здесь SLP имеет 2 входных нейрона и один выходной нейрон (мы делаем регрессию). Но что, если мы создадим новую функцию x2
, которую мы создадим из x1^2
. Мы просто добавляем еще один входной нейрон в SLP. Функция, которую SLP теперь изучит, выглядит следующим образом:
y = w0 + w1*x1 + w2*x1^2
Это квадратичная c функция, а не линейная функция?
Может кто-нибудь объяснить мне это?
Можем ли мы сказать, что с SLP мы можем выучить нелинейную функцию, если определим сами базовые функции (например, x1 ^ 2). Напротив, MLP изучит их самостоятельно? Спасибо.