Запуск симуляции распределения многократно прерывается после первого запуска - PullRequest
0 голосов
/ 26 мая 2010

Фон
У меня есть группа студентов, их желаемые проекты и руководители соответствующих проектов. Я запускаю серию симуляций, чтобы увидеть, какие проекты заканчиваются студентами, что позволит мне получить некоторую полезную статистику, необходимую для обратной связи. Итак, это, по сути, Monte-Carlo симуляция, в которой я рандомизирую список студентов, а затем перебираю его, распределяя проекты, пока не достигну конца списка. Затем процесс повторяется снова.

Обратите внимание, что в течение одного сеанса после каждого успешного размещения проекта происходит следующее:
+ проект установлен на allocated и не может быть передан другому ученику
+ руководитель имеет фиксированных quota студентов, которых он может контролировать. Это уменьшается на 1
+ Как только quota достигнет 0, все проекты этого супервизора станут blocked, и это будет иметь тот же эффект, что и проект allocated

Код

def resetData():
    for student in students.itervalues():
        student.allocated_project = None

    for supervisor in supervisors.itervalues():
        supervisor.quota = 0

    for project in projects.itervalues():
        project.allocated = False
        project.blocked = False

Роль resetData() состоит в том, чтобы «сбрасывать» определенные биты данных. Например, когда проект успешно выделен, project.allocated для этого проекта переключается на True. Хотя это полезно для одного прогона, для следующего прогона я должен быть освобожден.

Выше я перебираю три словаря - по одному для студентов, проектов и руководителей - где хранится информация.

Следующий бит - это симуляция "Монте-Карло" для алгоритма распределения.

sesh_id = 1

for trial in range(50):

    for id in randomiseStudents(1):
        stud_id = id
        student = students[id]
        if not student.preferences:
        # Ignoring the students who've not entered any preferences

            for rank in ranks:
                temp_proj = random.choice(list(student.preferences[rank]))

                if not (temp_proj.allocated or temp_proj.blocked):
                    alloc_proj = student.allocated_proj_ref = temp_proj.proj_id
                    alloc_proj_rank = student.allocated_rank = rank
                    successActions(temp_proj)
                    temp_alloc = Allocated(sesh_id, stud_id, alloc_proj, alloc_proj_rank)
                    print temp_alloc # Explained
                    break                  
    sesh_id += 1
    resetData()  # Refer to def resetData() above

Все, что делает randomiseStudents(1) - это рандомизирует порядок студентов.

Allocated - это класс, определяемый так:

class Allocated(object):
    def __init__(self, sesh_id, stud_id, alloc_proj, alloc_proj_rank):
        self.sesh_id = sesh_id
        self.stud_id = stud_id
        self.alloc_proj = alloc_proj
        self.alloc_proj_rank = alloc_proj_rank

   def __repr__(self):
        return str(self)

   def __str__(self):
        return "%s - Student: %s (Project: %s - Rank: %s)" %(self.sesh_id, self.stud_id, self.alloc_proj, self.alloc_proj_rank)

Output and problem

Теперь, если я запускаю это, я получаю вывод, такой как этот (усеченный):

1 - Student: 7720 (Project: 1100241 - Rank: 1)
1 - Student: 7832 (Project: 1100339 - Rank: 1)
1 - Student: 7743 (Project: 1100359 - Rank: 1)
1 - Student: 7820 (Project: 1100261 - Rank: 2)
1 - Student: 7829 (Project: 1100270 - Rank: 1)
.
.
.
1 - Student: 7822 (Project: 1100280 - Rank: 1)
1 - Student: 7792 (Project: 1100141 - Rank: 7)
2 - Student: 7739 (Project: 1100267 - Rank: 1)
3 - Student: 7806 (Project: 1100272 - Rank: 1)
.
.
.
45 - Student: 7806 (Project: 1100272 - Rank: 1)
46 - Student: 7714 (Project: 1100317 - Rank: 1)
47 - Student: 7930 (Project: 1100343 - Rank: 1)
48 - Student: 7757 (Project: 1100358 - Rank: 1)
49 - Student: 7759 (Project: 1100269 - Rank: 1)
50 - Student: 7778 (Project: 1100301 - Rank: 1)

В принципе, он отлично работает для первого прогона, но при последующих прогонах, ведущих к n -ому прогону, в данном случае 50, возвращается только одна пара распределения студент-проект.

Таким образом, главная проблема, с которой у меня возникают проблемы, - выяснить, что является причиной этого аномального поведения, тем более что первый запуск работает без сбоев.

Заранее спасибо,

Az

1 Ответ

0 голосов
/ 26 мая 2010

Вы действительно намереваетесь установить квоту руководителя на 0 в resetData()? Разве это не значит, что все их проекты теперь заблокированы?

Ворона:

У руководителя есть фиксированная квота студентов, которых он может контролировать. Это уменьшается на 1. Как только квота достигает 0, все проекты этого супервизора блокируются, и это имеет тот же эффект, что и выделяемый проект.

Если это не так, вы должны проверить вывод randomiseStudents(), чтобы убедиться, что он возвращает полный список. В конце концов, это управляющий элемент для этого внутреннего цикла.


Обновление на основе комментариев:

Похоже, проблема была в том, что вы установили для квоты супервизора значение 0, что сделало все их проекты заблокированными.

Это чистая догадка с моей стороны, но вы, вероятно, привлекали одного студента в каждой итерации, потому что проверка всех супервизоров происходила после распределения. В этом случае только что выделенная квота будет иметь квоту -1, а все остальные квоты будут равны 0, что фактически остановит все выделения после этого.

В идеале вы хотели бы установить для квоты супервизора исходное значение в resetData(). Если бы это была фиксированная квота (одинаковая для каждого руководителя), вы могли бы просто использовать:

for supervisor in supervisors.itervalues():
    supervisor.quota = 7 # for example

Если бы у каждого супервизора была своя квота, вам нужно было бы сохранить ее вместе с другой информацией (во время инициализации, но не сброса), как, например, supervisor.start_quota. Тогда вы можете использовать:

for supervisor in supervisors.itervalues():
    supervisor.quota = supervisor.start_quota
...