Нейронная сеть "Разведение" - PullRequest
8 голосов
/ 23 октября 2009

Я только что посмотрел видео-презентацию Google о технологиях Polyworld (найдена здесь ), и они рассказывают о скрещивании двух нейронных сетей для формирования потомства. Мой вопрос: как можно объединить две нейронные сети? Они кажутся настолько разными, что любая попытка объединить их просто создаст третью, совершенно не связанную сеть. Возможно, я что-то упускаю, но я не вижу хорошего способа взять положительные аспекты двух отдельных нейронных сетей и объединить их в одну. Если бы кто-нибудь мог подробно остановиться на этом процессе, я был бы признателен.

Ответы [ 3 ]

13 голосов
/ 23 октября 2009

Пока что ни один из ответов не верен природе Полмира! ...

Они оба описывают типичный Генетический алгоритм (GA). В то время как GA включает в себя некоторые элементы, найденные в Polyworld (селекция, отбор), GA также подразумевает некоторую форму «объективных» критериев, направленных на направление эволюции к [относительно] конкретным целям.

Polyworld, с другой стороны, является основой для Искусственная жизнь (ALife). С ALife, выживание отдельных существ и их способность передавать свои гены другим поколениям, не так сильно зависит от их способности удовлетворять определенной «фитнес-функции» , но вместо этого оно связано с различные более широкие, нецелевые критерии , такие как способность индивида прокормить себя способами, соразмерными его размеру и метаболизму, его способность избегать хищников, его способность находить партнеров по спариванию, а также различные дозы удачи и случайности.

Модель Полмира , связанная с существами и их миром, относительно фиксирована (например, все они имеют доступ (хотя могут и не использовать) к различным базовым датчикам (для цвета, для формы ...) и различные исполнительные механизмы ("устройства", чтобы есть, соединять, поворачивать, двигаться ...), и эти основные сенсорные и моторные функции не развиваются (как это может быть в природе, например, когда существа находят способы стать чувствительными к теплу или звукам и / или найти способы перемещения, отличающиеся от оригинальных примитивов движения и т. д.)

С другой стороны, мозг существ имеет структуру и связи, которые являются одновременно продуктом генетической структуры существа ("материал" от его предков) и его собственного опыта . Например, основной алгоритм, используемый для определения силы связей между нейронами, использует логику Хевбия (т. Е. Пожарную связь, проводную связь) в течение жизни существа (я полагаю, в самом начале, поскольку алгоритм часто имеет «охлаждение»). «фактор, который сводит к минимуму его способность изменить вещи в значительной степени, как проходит время). Неясно, включает ли модель некоторую форму эволюции ламаркианцев, посредством чего некоторые из поведений высокого уровня [прямо] передаются через гены, а не [возможно] переучиваются с каждым поколением (на косвенной основе некоторых генетически переданных структура). * +1027 *

Существенная разница между ALife и GA (а есть и другие!) Заключается в том, что в ALife основное внимание уделяется наблюдению и развитию не направленными способами , эмерджентные поведения - какими бы они ни были - , такие как, например, когда некоторые существа развивают косметику, которая побуждает их ждать близлежащие кучи зеленой еды и ждать, пока темно-зеленые существа не убьют их, или некоторые существа могут начать сотрудничать с друг с другом, например, путем поиска присутствия друг друга для других целей, кроме спаривания и т. д. В GA основное внимание уделяется конкретному поведению развивающейся программы . Например, цель может состоять в том, чтобы программа распознала края в видеоизображении, и, следовательно, эволюция предпочтительнее в этом конкретном направлении. Отдельные программы, которые лучше справляются с этой задачей (например, с помощью «фитнес-функции»), предпочтительнее в отношении эволюции.

Другое менее очевидное, но важное различие касается способа, которым существа (или программы в случае GA) воспроизводят себя. С ALife отдельные существа находят своих собственных партнеров по спариванию , сначала наугад, хотя через некоторое время они могут научиться размножаться только с существами, обладающими определенным атрибутом или поведением. С GA, с другой стороны, «пол» оставлен самой структуре GA , которая выбирает, например, предпочтительное скрещивание особей (и их клонов), которые хорошо оценивают фитнес-функцию ( и всегда оставляя место для некоторой случайности, чтобы поиск решения не застрял в некоторых локальных максимумах, но дело в том, что структура GA в основном решает, кто с кем имеет секс) ...

Уточнив это, мы можем вернуться к первоначальному вопросу ОП ...
... как можно объединить две нейронные сети? Они кажутся настолько разными, что любая попытка объединить их просто создаст третью, совершенно не связанную сеть. ... Я не вижу хорошего способа взять положительные аспекты двух отдельных нейронных сетей и объединить их в одну ...
«генетическая структура» конкретного существа влияет на параметры , такие как размер существа, его цвет и тому подобное. Он также включает параметры, связанные с мозгом, в частности его структуру: количество нейронов, наличие связи с различными датчиками (например, очень ли хорошо видит существо синий цвет?), Наличие связей с различными исполнительными механизмами (например, использует ли существо свой свет?). Специфические связи между нейронами и их относительная сила также могут передаваться в генах, если только они служат начальными значениями, которые быстро изменяются на этапе обучения мозга.
Взяв два существа, мы [природа!] Можем выбрать более или менее случайным образом, какой параметр поступает от первого существа, а какой - от другого существа (а также несколько новых «мутаций») которые приходят ни от одного из родителей). Например, если у «отца» было много связей с датчиком красного цвета, но мать не делала, чтобы потомство могло выглядеть как отец в этой области, но также получало структуру из 4 слоев нейрона своей матери, а не структуру из 6 слоев отца. .
Интерес состоит в том, чтобы открыть новые возможности от людей ; в приведенном выше примере существо теперь может лучше обнаруживать хищников красного цвета, а также быстрее обрабатывать информацию в своем немного более простом мозге (по сравнению с отцом). Не все потомки лучше оснащены, чем их родители, такие более слабые особи могут исчезнуть в короткие сроки (или, возможно, и, к счастью, выжить достаточно долго, чтобы обеспечить, скажем, их причудливый способ передвижения и уклонения от хищников, даже если их родители сделали их слепыми или слишком велико или что-то еще ... Ключевое слово: - не беспокоиться о немедленной полезности конкретной черты, а только увидеть, как она играет в долгосрочной перспективе .

7 голосов
/ 23 октября 2009

Они бы на самом деле не разводили две нейронные сети вместе. Предположительно, они имеют различные генетические алгоритмы, которые производят определенную структуру нейронной сети с учетом определенной последовательности «генов». Они начинали с популяции последовательностей генов, создавали свои характерные нейронные сети, а затем подвергали каждую из этих сетей одному и тому же режиму обучения. Предположительно, некоторые из этих сетей будут реагировать на обучение лучше, чем некоторые другие (то есть они будут легче "обучаться" для достижения желаемого поведения). Затем они брали генетические последовательности, которые давали лучших «стажеров», скрещивали их друг с другом, создавали свои характерные нейронные сети, которые затем подвергались бы той же схеме обучения. Предположительно, некоторые из этих нейронных сетей во втором поколении были бы даже более обучаемыми, чем в первом поколении. Они станут родителями третьего поколения, и так далее, и тому подобное.

4 голосов
/ 23 октября 2009

Нейронные сети не являются (вероятно) в этом случае произвольными деревьями. Вероятно, это сети с постоянной структурой, то есть одинаковыми узлами и соединениями, поэтому их «разведение» потребует «усреднения» весов узлов. Вы можете усреднить веса для каждой пары узлов в двух соответствующих сетях, чтобы получить сеть «потомков». Или вы можете использовать более сложную функцию, зависящую от постоянно расширяющихся наборов соседних узлов - возможности огромны. Мой ответ неполон, если предположение о фиксированной структуре является ложным или необоснованным.

...