Варианты хранения данных: Зависит от
Простые, не обучающиеся боты: XML в порядке
Похоже, у вас уже есть базовая XML-структура. Для начала я бы сказал, что это нормально, особенно для ботов, поддерживающих искусственный интеллект (if userMsg.contains('lega') then print('TOS & Copyright...'
).
Конечно, переключение на любой новый формат потребует времени и затрат.
Обучение, Сложные боты: база данных!
Если вы хотите сделать что-то гораздо большее, особенно если вы имеете в виду CleverBot , я думаю, вам понадобится база данных. Это потому, что когда ваш файл .. является файлом и гигантским, и попытка сохранить все это доступным в памяти требует больших ресурсов. Для такого проекта я бы порекомендовал базу данных.
Почему? Сложный английский
Некоторое время назад я написал сортировщик спама Nieve Bayes. Потребовалось около 10000 спама, чтобы «обучить» его с точностью 7%, что заняло около 6 часов и 1,5 ГБ ОЗУ для хранения данных в памяти. Это много данных. Английский очень сложен и не может быть действительно разбит на if 'pony' then 'saddle'
, поэтому для того, чтобы бот "выучил" лучшие ответы, ваша база данных станет массовой и очень быстрой.