Возможность победить тест Тьюринга с современным программным обеспечением? - PullRequest
0 голосов
/ 30 октября 2009

Я спрашиваю об этом академически, я хочу задать вслух очень важный вопрос, и сообщество попытается ответить на него. Можем ли мы создать систему, которая генерирует сцену для воспроизведения в живом анонимном групповом видео-чате, который может читать набранный текст и отвечать с помощью чат-бота?

Живое интернет-видео часто размыто и имеет низкое разрешение. Нельзя разглядеть много деталей на сцене далекой вечеринки. Сцены можно визуализировать с помощью современных программных инструментов, которые выглядят очень реалистично, когда не движутся. Заставить их двигаться реалистично - это большая часть программного обеспечения для моделирования.

Лица могут отображаться со скоростью 24 кадра в секунду с помощью кластера из 24 систем, способных работать с 1 кадром в секунду. Тогда видео будет иметь задержку в 1 секунду с момента принятия решения о том, какое выражение лица генерировать. Эти выражения лица и их генерация является ключевой проблемой. Требование реалистичности скинов является решаемой проблемой графического сообщества.

выражения лица были классифицированы несколькими исследователями. Их также можно отрендерить, это было показано в современной литературе по компьютерной графике. Мы можем сделать это, если сможем узнать, какие из них подходят для данной ситуации.

Чат-боты использовались десятилетиями. В настоящее время существуют довольно «умные» программы чата, которые будут читать то, что им задают, и отвечать разумным образом. Они всегда делали это с помощью текста, но программное обеспечение для чтения текста может говорить человеческим голосом, а программное обеспечение для распознавания речи с каждым годом становится все лучше.

Что я предлагаю, так это тот факт, что соединить все эти разрозненные части разработки программного обеспечения и создать поистине удивительный инструмент для тестирования Тьюринга должно быть довольно элементарно.

Эта программа может войти в виртуальное пространство и отображать реалистичную среду, как будто на веб-камере, как и другие участники. Он может наблюдать за выражением их лица, слушать их речь и читать их текст. Затем он может создать ответ и либо напечатать, либо сказать его группе. Выбор того, с чем отвечать, является трудной проблемой, с которой не справился даже большинство людей. Мы можем подойти к этому с большой работой.

Тест Тьюринга - это доказательство того, что коммуникатор - человек, но «доказательство» только в том смысле, что он достаточно хорош, чтобы обмануть судей. Если человеческие судьи просто все, они вряд ли будут применять строгую формальную процедуру. Догадываться или поддаваться на хитрость достаточно хорошо.

Как вы думаете, мы можем сделать это?

Является ли этот план ошибочным? Есть ли моральные последствия, чтобы обмануть обычного зрителя таким образом? Можем ли мы заработать миллионы долларов, создав личных умных помощников?

Ответы [ 4 ]

2 голосов
/ 30 октября 2009

В этой области уже ведутся исследования. Цифровые аватары были использованы с некоторым успехом. Некоторые из ключевых моментов:

  • Современные ПК могут воспроизводить убедительное человеческое лицо в режиме реального времени, без проблем. Просто вставьте карту среднего размера и хорошую модель, и все готово. (см., например, Рассвет ).

  • Современное программное обеспечение для генерации голоса может воспроизводить свободный текст и может правильно произносить его. Это все еще немного однообразно, так как у говорящего нет эмоций. (См. эту статью ).

  • Существует исследование, чтобы заставить машины "чувствовать". Я говорю «чувствую», потому что это просто небольшая программа с парой переменных («гнев», «страх», «голод», «скучно», «грусть», ...) и сложный набор правил, которые влияют эти переменные. (Подробности см. В статье Википедии ).

Основная проблема сейчас в том, что мы не знаем, что такое эмоции. Являются ли они просто количеством молекул, плавающих в определенных частях мозга? Если да, то какие молекулы и в какой части мозга? Нейробиологи сегодня пытаются предсказать состояние ума, глядя на изображения МРТ. Чтобы понять, что это значит, вот аналогия: они пытаются угадать, что задумано человечеством, взглянув на распределение света на Земле от Луны невооруженным глазом.

Итак, мы не понимаем, что такое эмоции. Следующее препятствие состоит в том, что эмоции ничего не значат без контекста. Легко написать программу, которая кажется «грустной», просто установив значение переменной sadness равным 1,0. Но это было бы странно, если бы не было причины. Таким образом, программа должна быть в состоянии проследить за разговором, сформировать его мысленный образ (о чем люди говорят и , что они чувствуют сейчас), а затем скорректировать свое собственное психическое состояние в соответствии с текущими соответствующая группа.

Вы знаете, каково это, когда вы впервые вступаете в новую группу и пытаетесь понять, что происходит и как вы должны себя вести. Это сложная задача для людей и, тем более, для программы.

Есть статья "Können wir eine Seele simulieren?" (только Geman, но вывод Google переводчика довольно хорош.)

2 голосов
/ 30 октября 2009

Я не согласен с присутствием здесь вашего вопроса, но я считаю необходимым указать, что вы совершенно не поняли, в чем смысл теста Тьюринга. Это не имеет ничего общего с тем, чтобы выглядеть как человек или как человек.

На самом деле, большинство предлагаемых испытаний включают терминал телетайпа с задержкой по времени, поэтому передача информации настолько мала, насколько это возможно, помимо реальной проверяемой связи.

Я не хочу разбить ваш пузырь, но нынешнее поколение чат-ботов и даже самые продвинутые ИИ в лаборатории еще далеко не победили тест Тьюринга. Очень быстро становится очевидно, что там нет реального человека.

2 голосов
/ 30 октября 2009

Мы не можем пройти традиционный текстовый тест Тьюринга. Добавление видео сверху не имеет значения.

1 голос
/ 30 октября 2009

Большая проблема не в том, чтобы визуализировать (визуально или вокально), а в том, чтобы передать интеллект и эмоции.

То, что вы предлагаете, - это интерфейс Шрека в реальном времени. Но как насчет серверной части?

...