Попробуйте использовать простой текстовый процессор, такой как awk (или gawk), для генерации XML. Шаблон будет выглядеть следующим образом.
BEGIN {
print "<?xml version=\"1.0\" encoding=\"utf-8\"?>";
print "<config-type>";
}
{ print " <" $1 ">" $2 "</" $1 ">"; }
END { print "</config-type>"; }
Убедитесь, что кодировка верна. Для файлов конфигурации на английском языке достаточно «ASCII».
После этого вы можете использовать самые разные инструменты для обработки этого XML. Я предлагаю использовать этот формат, потому что его проще всего создавать и обрабатывать:
<config-type>
<KEYWORD1>DATA1</KEYWORD1>
<KEYWORD2>DATA2</KEYWORD2>
<KEYWORD3>DATA3</KEYWORD3>
</config-type>
Используйте разные имена для "config-type" для каждого типа конфигурационного файла, чтобы их было легко отличить.
Чтобы проверить формат XML, самый простой способ - определить DTD для него. Многие редакторы XML могут читать существующий файл XML и создавать для него DTD. Это DTD не будет идеальным, но это будет очень хорошая отправная точка.
Затем можно указать имя DTD в заголовке XML и указать синтаксическому анализатору XML проверить структуру (но не данные).
Для проверки данных вы можете использовать XML-схему, но XML-схема очень сложна и часто является чрезмерным.