Logisti c regression - странное поведение границы решения при добавлении дополнительных параметров - PullRequest
1 голос
/ 20 февраля 2020

Я пытаюсь построить регрессионную модель логистики c для набора данных, состоящего из двух параметров x 1 и x 2 , но вместо анализа только двух из них, Я также добавил их квадраты - x 1 2 , x 2 2 и x 1 · x 2 .

На первый взгляд все выглядит хорошо, и функция ошибок уменьшается, но, рисуя график границы решения, я заметил, что после примерно 500 итераций происходит что-то странное Это. Вот анимация функции ошибки как функции итераций и соответствующего графика границы решения: enter image description here

Теперь я интерпретирую границу решения как квадратичный c функция x 2 = f (x 1 ), где соотношение между обоими параметрами задано так: 0,5 = θ 0 + θ 1 x 1 + θ 2 x 2 + θ 3 x 1 2 + θ 4 x 1 x 2 + θ 5 x 2 2

Вот код python, который я использую для всего:

#!/usr/bin/python3

import numpy as np
import matplotlib.pyplot as plt
from math import log
from matplotlib.animation import FuncAnimation

def sigmoid(x):
    return 1.0 / (1.0 + np.exp(-x))

def loadData(filepath):
    source=""
    try:
        f = open(filepath, "r")
        source = f.read()
        f.close()
    except IOError:
        print("Error while reading file (" + filepath + ")")
        return ""
    raw_data = source.split("\n")
    raw_data = [x.split(",") for x in raw_data if x !=""]
    raw_data = np.matrix(raw_data).astype(float)
    return (raw_data[:,:np.size(raw_data,1)-1], raw_data[:,np.size(raw_data, 1)-1:])

def standardize(dataset, skipfirst=True):
    means = np.amin(dataset, 0)
    deviation = np.std(dataset, 0)
    if skipfirst:
        dataset[:,1:] -= means[:,1:]
        dataset[:,1:] /= deviation[:,1:]
        return dataset
    else:
        dataset -= means
        dataset /= deviation
        return dataset

def error(X, Y, Theta):
    "Calculates error values"
    v_sigm = np.vectorize(sigmoid)
    h_x = X @ Theta
    sigmo = v_sigm(h_x)
    partial_vect = (Y-1).T @ np.log(1-sigmo) - Y.T @ np.log(sigmo) 
    return 1/(2*np.size(Y, axis=0))*np.sum(partial_vect)

def gradientStep(X, Y, Theta, LR):
    "Returns new theta Values"
    v_sigm = np.vectorize(sigmoid)
    h_x = X @ Theta
    modif = -1*LR/np.size(Y, 0)*(h_x-Y) 
    sums = np.sum(modif.T @ X, axis = 0)
    return Theta + sums.T

X, Y = loadData("ex2data1.txt")
#add bias to X
X = np.append(np.ones((np.size(X, 0), 1)), X, axis=1)
added_params = [[x[1]**2, x[1]*x[2], x[2]**2] for x in np.array(X)]
X = np.append(X, np.matrix(added_params), axis=1)
#standardize X
X = standardize(X)
#create vector of parameters
Theta=np.zeros((np.size(X, 1), 1))

iterations = 3000

Theta_vals = []
Error_vals = []

for i in range(0, iterations):
    Theta_vals.append(np.asarray(Theta).flatten())
    Error_vals.append(error(X, Y, Theta))
    Theta = gradientStep(X, Y, Theta, 0.07)


#CALCULATING FINISHES HERE

#plot data:
fig = plt.figure()
def_ax = fig.add_subplot(211)
def_ax.set_xlim(np.amin(X[:,1:2]), np.amax(X[:,1:2]))
def_ax.set_ylim(np.amin(X[:,2:3]), np.amax(X[:,2:3]))
err_ax = fig.add_subplot(212)
err_ax.set_ylim(0, error(X, Y, Theta))
err_ax.set_xlim(0, iterations)
positive_X1 = []
positive_X2 = []
negative_X1 = []
negative_X2 = []
for i in range(0, np.size(Y, 0)):
    if(Y[i, 0] == 1):
        positive_X1.append(X[i, 1])
        positive_X2.append(X[i, 2])
    else:
        negative_X1.append(X[i, 1])
        negative_X2.append(X[i, 2])


err_ax.set_ylim(np.amin(Error_vals), np.amax(Error_vals))

def animation(frame):
    global Theta_vals, Error_vals, def_ax, err_ax, positive_X1, positive_X2, negative_X1, negative_X2
    def_limX = def_ax.get_xlim()
    def_limY = def_ax.get_ylim()
    err_limX = err_ax.get_xlim()
    err_limY = err_ax.get_ylim()
    def_ax.clear()
    err_ax.clear()
    def_ax.set_xlim(def_limX)
    def_ax.set_ylim(def_limY)
    err_ax.set_xlim(err_limX)
    err_ax.set_ylim(err_limY)
    def_ax.scatter(positive_X1, positive_X2, marker="^")
    def_ax.scatter(negative_X1, negative_X2, marker="o")
    Theta = Theta_vals[frame]
    res_x = np.linspace(*def_ax.get_xlim(), num=5)
    delta_x = [(Theta[4]*x+Theta[2])**2-4*Theta[5]*(Theta[3]*x**2+Theta[1]*x+Theta[0]-0.5) for x in res_x]
    delta_x = [np.sqrt(x) if x >= 0 else 0 for x in delta_x]
    minb = [-(Theta[4]*x+Theta[2]) for x in res_x]
    res_1 = []
    res_2 = []
    for i in range(0, len(res_x)):
            if Theta[5] == 0:
                res_1.append(0)
                res_2.append(0)
            else:
                res_1.append((minb[i]+delta_x[i])/(2*Theta[5]))
                res_2.append((minb[i]-+delta_x[i])/(2*Theta[5]))
    def_ax.plot(res_x, res_1)
    def_ax.plot(res_x, res_2)
    err_x = np.linspace(0, frame, frame)
    err_y = Error_vals[0:frame]
    err_ax.plot(err_x, err_y)


anim = FuncAnimation(fig, animation, frames=iterations, interval=3, repeat_delay=2000)
print(error(X, Y, Theta))
anim.save("anim.mp4")

Что может быть причиной такого странного поведения?

...