Масштабирование функций в инкрементальном анализе - PullRequest
0 голосов
/ 03 августа 2020

Я провожу инкрементальный анализ своих данных. Данные относятся к 4 возрастным группам (день 1, день 2, день 3 и день 4). Прежде чем передать данные в модель, я стандартизирую функции, используя стандартную реализацию масштабатора в sklearn. Когда я думаю об этом, мне приходят в голову 3 подхода.

Approach (1)standardize the newly added data separately
days = [day1, day2, day3, day4]

data=[]
for day in days:
    standard_scaler = StandardScaler()
    scaled = standard_scaler.fit_transform(day)
    data.append(scaled)
    Y = model.fit_transform(data)

Approach (2)standardize all the data up to the current day together separately
days = [day1, day2, day3, day4]

data=[]
for day in days:
    data.append(day)
    standard_scaler = StandardScaler()
    scaled = standard_scaler.fit_transform(data)
    Y = model.fit_transform(scaled)

Approach (3)partial_fit the same standard scaler on the newly added increments
    days = [day1, day2, day3, day4]
    standard_scaler = StandardScaler()

    data=[]
    for day in days:
        standard_scaler.partial_fit(day)
        data.append(day)
        scaled = standard_scaler.transform(data)
       
        Y = model.fit_transform(scaled)

Посоветуйте, пожалуйста, какой метод лучше всего подходит.

1 Ответ

0 голосов
/ 03 августа 2020

подход 1 - лучший и фактически единственно правильный

...