qloguniform проблема установки пространства поиска в Hyperopt - PullRequest
0 голосов
/ 15 декабря 2018

Я работаю над использованием hyperopt для настройки моей модели ML, но у меня проблемы с использованием qloguniform в качестве пространства поиска.Я привожу пример из официальной вики и изменил пространство поиска.

import pickle
import time
#utf8
import pandas as pd
import numpy as np
from hyperopt import fmin, tpe, hp, STATUS_OK, Trials

def objective(x):
    return {
        'loss': x ** 2,
        'status': STATUS_OK,
        # -- store other results like this
        'eval_time': time.time(),
        'other_stuff': {'type': None, 'value': [0, 1, 2]},
        # -- attachments are handled differently
        'attachments':
            {'time_module': pickle.dumps(time.time)}
        }
trials = Trials()
best = fmin(objective,
    space=hp.qloguniform('x', np.log(0.001), np.log(0.1), np.log(0.001)),
    algo=tpe.suggest,
    max_evals=100,
    trials=trials)
pd.DataFrame(trials.trials)

Но появляется следующая ошибка.

ValueError: ('отрицательный аргумент в lognormal_cdf', массив ([- 3.45387764, -3.45387764, -3.45387764, -3.45387764, -3.45387764, -3,45387764, -3,45387764, -3,45387764, -3,45387764, -3,45387764, -3,45387764, -3,45387764, -3,45387764, -3,45387764, -3,45387764, -3,45387764, -3,45387764, -3,45387764, -3,45387764, -3,45387764, -3,45387764,-3.45387764, -3.45387764, -3.45387764]))

Я пробовал без преобразования журнала, как показано ниже, но выходные значения оказываются преобразованием журнала (например, 1.017,1.0008), 1.02456), что неверно.Это соответствует документации.

hp.qloguniform('x', 0.001,0.1, 0.001)

Спасибо

1 Ответ

0 голосов
/ 18 декабря 2018

Кажется, проблема в последнем аргументе hp.qloguniform, q и как tpe.suggest использует это.

  1. Сначала давайте поговорим о q.Согласно документации:

    hp.qloguniform (метка, низкий, высокий, q)

    round(exp(uniform(low, high)) / q) * q 
    

    Подходит для дискретной переменной, относительно которойцель является «гладкой» и становится более гладкой с размером значения, но которая должна быть ограничена как сверху, так и снизу.

    q здесь есть "quantizer", который ограничит выходы изопределенное пространство, кратное q.Например, вот что происходит внутри qloguniform:

    from hyperopt import pyll, hp
    n_samples = 10
    
    space = hp.loguniform('x', np.log(0.001), np.log(0.1))
    evaluated = [pyll.stochastic.sample(space) for _ in range(n_samples)]
    # Output: [0.04645754, 0.0083128 , 0.04931957, 0.09468335, 0.00660693,
    #          0.00282584, 0.01877195, 0.02958924, 0.00568617, 0.00102252]
    
    q = 0.005
    qevaluated = np.round(np.array(evaluated)/q) * q
    # Output: [0.045, 0.01 , 0.05 , 0.095, 0.005, 0.005, 0.02 , 0.03 , 0.005, 0.])
    

    Сравните здесь evaluated и qevaluated.qevaluated кратно q или мы говорим, что оно квантовано в «интервалах» (или шагах) q.Вы можете попробовать изменить значение q, чтобы узнать больше.

    Значение q, которое вы определили в вопросе, чрезвычайно велико по сравнению с сгенерированным диапазоном выборки (0.001 to 0.1):

    np.log(0.001)
    # Output: -6.907755278982137
    

    Таким образом, выходные данные всех значений здесь будут 0.

    q = np.log(0.001)
    qevaluated = np.round(np.array(evaluated)/q) * q
    # Output: [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]
    
  2. Теперь перейдем к tpe.suggest (Раздел 4 этой статьи ):TPE использует дерево различных оценщиков для оптимизации процесса поиска, во время которого он делит пространство поиска в зависимости от генератора пространства (в данном случае qloguniform).См. код здесь для деталей.Для разделения пространства на несколько частей он будет использовать q.

    Но поскольку все точки в вашем пространстве будут равны 0,0 (как описано выше), этот отрицательный q генерирует недопустимые границы для lognormal_cdf , что недопустимо и, следовательно, ошибка.

Короче говоря, использование q неверно.Как вы уже сказали в комментарии: -

Кроме того, значение q не должно использоваться внутри логарифмической / логарифмической случайной выборки в соответствии с round(exp(uniform(low, high)) / q) * q

поэтому вы должны указывать только значения q, которые действительны для вашего требуемого пространства.Итак, здесь, поскольку вы хотите генерировать значения между 0.001 и 0.1, значение q должно быть сопоставимо с ними.

Я согласен, что вы поставляете np.log(0.001) и np.log(0.1) внутри qloguniform, но это так, что выходные значения находятся в диапазоне от 0,001 до 0,1.Так что не используйте np.log в q.q следует использовать согласно сгенерированным значениям.

...