что этот код Python пытается сделать - PullRequest
1 голос
/ 18 февраля 2010

Следующий код Python предназначен для обхода двумерной сетки (c, g) в каком-то особом порядке, который хранится в «jobs» и «job_queue». Но я не уверен, что это за порядок после попытки понять код. Может ли кто-то рассказать о заказе и дать какое-то объяснение цели каждой функции? Спасибо и всего наилучшего!

import Queue

c_begin, c_end, c_step = -5,  15, 2  
g_begin, g_end, g_step =  3, -15, -2  

def range_f(begin,end,step):  
    # like range, but works on non-integer too  
    seq = []  
    while True:  
        if step > 0 and begin > end: break  
        if step < 0 and begin < end: break  
        seq.append(begin)  
        begin = begin + step  
    return seq  

def permute_sequence(seq):  
    n = len(seq)  
    if n <= 1: return seq  

    mid = int(n/2)  
    left = permute_sequence(seq[:mid])  
    right = permute_sequence(seq[mid+1:])  

    ret = [seq[mid]]  
    while left or right:  
        if left: ret.append(left.pop(0))  
        if right: ret.append(right.pop(0))  

    return ret  

def calculate_jobs():  
    c_seq = permute_sequence(range_f(c_begin,c_end,c_step))  
    g_seq = permute_sequence(range_f(g_begin,g_end,g_step))  
    nr_c = float(len(c_seq))  
    nr_g = float(len(g_seq))  
    i = 0  
    j = 0  
    jobs = []  

    while i < nr_c or j < nr_g:  
        if i/nr_c < j/nr_g:  
            # increase C resolution  
            line = []  
            for k in range(0,j):  
                line.append((c_seq[i],g_seq[k]))  
            i = i + 1  
            jobs.append(line)  
        else:  
            # increase g resolution  
            line = []  
            for k in range(0,i):  
                line.append((c_seq[k],g_seq[j]))  
            j = j + 1  
            jobs.append(line)  
    return jobs  

def main():  

    jobs = calculate_jobs()  
    job_queue = Queue.Queue(0)  

    for line in jobs:  
        for (c,g) in line:  
            job_queue.put((c,g))  

main()

EDIT:

Существует значение для каждого (с, г). Код на самом деле заключается в поиске в двумерной сетке (c, g), чтобы найти точку сетки, где значение является наименьшим. Я думаю, что код использует какой-то эвристический алгоритм поиска? Оригинальный код здесь http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/gridsvr/gridregression.py,, который представляет собой скрипт для поиска алгоритма SVM лучших значений для двух параметров c и g с минимальной ошибкой проверки.

Ответы [ 2 ]

2 голосов
/ 18 февраля 2010

permute_sequence переупорядочивает список значений так, чтобы сначала было среднее значение, затем средняя точка каждой половины, затем средние точки четырех оставшихся кварталов и т. Д. Итак, permute_sequence(range(1000)) начинается так:

    [500, 250, 750, 125, 625, 375, ...]

calculate_jobs попеременно заполняет строки и столбцы, используя последовательности одномерных координат, предоставленные permute_sequence.

Если вы все равно собираетесь искать во всем 2D-пространстве, это не поможет вам быстрее закончить. Вы также можете просто отсканировать все точки по порядку. Но я думаю, что идея заключалась в том, чтобы найти приличное приближение минимума как можно раньше при поиске. Я подозреваю, что вы могли бы сделать то же самое, перетасовывая список случайным образом.

читатели xkcd заметят, что протокол писсуара даст только немного другие (и, вероятно, лучшие) результаты:

    [0, 1000, 500, 250, 750, 125, 625, 375, ...]
1 голос
/ 18 февраля 2010

Вот пример permute_sequence в действии:

print permute_sequence(range(8))
# prints [4, 2, 6, 1, 5, 3, 7, 0]
print permute_sequence(range(12))
# prints [6, 3, 9, 1, 8, 5, 11, 0, 7, 4, 10, 2]

Я не уверен , почему использует этот порядок, потому что в main кажется, что все пары-кандидаты (c, g) все еще оцениваются, я думаю.

...