искусственный интеллект - Писательское искусство - PullRequest
3 голосов
/ 05 августа 2009

Я пытаюсь найти информацию (и, надеюсь, исходный код c #) о попытке создать базовый инструмент ИИ, который может понимать английские слова, грамматику и контекст.

Идея состоит в том, чтобы обучить ИИ, используя как можно больше письменных документов, а затем на основе этих документов, чтобы ИИ создавал свои собственные творческие материалы на надлежащем английском языке, которые имеют смысл для человека.

Хотя идея проста, я понимаю, что препятствия огромны, любые начальные точки или хорошие ресурсы будут оценены.

Ответы [ 7 ]

5 голосов
/ 05 августа 2009

A basic AI-инструмент, который вы можете использовать для создания чего-то подобного, это цепь Маркова. Это на самом деле не так уж сложно написать!

См .: http://pscode.com/vb/scripts/ShowCode.asp?txtCodeId=2031&lngWId=10

Если этого недостаточно, вы можете хранить WordNet в своей цепочке Маркова, а не только слова. Это дает вам некоторый смысл значения слов.

2 голосов
/ 31 октября 2009

Чтобы иметь возможность перекомпоновывать документ, который вам нужно будет иметь, чтобы отфильтровать плохие результаты.

Что означает:

  1. Вам нужно написать программу, которая сможет оценить, верен ли вывод (грамматически и синтаксически это лучшее, что вы можете сделать надежно) (Это будет НЛП)
  2. Вам понадобится много обучающих данных и данных испытаний
  3. Вы должны остерегаться перетренированности (посмотрите на кривые ROC)

Вместо написания инструмента вы можете:

  1. Оценка результата вручную (потребуется много времени, чтобы правильно обучить алгоритм)
    1. С этим использование Amazon Mechanical Turk может быть хорошей идеей

Ирония этого: компьютеру будет трудно "творчески" сочинять что-то новое. Вся его ценность будет основана на его предыдущем опыте [данные обучения]

1 голос
/ 05 августа 2009

Как уже говорили другие, цепь Маркова кажется наиболее подходящей для такой задачи. Хорошее описание реализации цепочки Маркова можно найти в Kernighan & Pike, Практика программирования, раздел 3.1 . Хорошее описание генерации текста также присутствует в Programming Pearls .

1 голос
/ 05 августа 2009

Несколько хороших ссылок и материалов для чтения Естественный язык статья.

0 голосов
/ 19 февраля 2010

Я согласен, что у вас будут проблемы при создании чего-то творческого. Вы также можете использовать спиннер ключевых слов для определенных слов. Возможно, вы также захотите внедрить фильтр стоп-слов, чтобы удалить что-нибудь разговорный.

0 голосов
/ 16 октября 2009

Взгляните на http://www.nltk.org/ (Natural Language Toolkit), множество мощных инструментов там. Они используют Python (не C #), но Python достаточно легко подобрать. Гораздо проще подобрать, чем широту и глубину обработки естественного языка, по крайней мере.

0 голосов
/ 05 августа 2009

Одна вещь, хотя и не совсем то, что вам нужно, это цепочка слов Маркова. Вот ссылка, которую я нашел с помощью быстрого поиска: http://blog.figmentengine.com/2008/10/markov-chain-code.html,, но вы можете найти гораздо больше информации, выполнив поиск.

...