Чтобы упростить мой вопрос, я в основном рассматриваю справочные страницы команд. например, «человек grep».
Страницы руководства более или менее структурированы. Большинство разделов и их представление являются стандартными, а объяснение можно найти на https://www.tldp.org/HOWTO/Man-Page/q3.html
(И источник справочной страницы, в groff, понять не сложно, даже не зная groff)
Мой вопрос: есть ли уже база данных с (более стандартными) справочными страницами. Или, по крайней мере, программу, принимающую в качестве входных данных страницу руководства (вероятно, в виде файла groff) и выводящую такую базу данных.
Здесь я имею в виду базу данных в очень смутном смысле. Sqlite или MySQL были бы идеальными. Но почтовый индекс csv также был бы великолепен.
Позвольте мне привести пример использования команды grep.
База данных будет иметь таблицу параметров с записью для каждого параметра. Эта запись будет содержать:
- фактические названия опций
- Аббревиатура (ы),
- описание того, что делает эта опция
- Секция ограждения.
, В CSV запись будет
--extended-regexp, -E, интерпретировать PATTERN как расширенное регулярное выражение (ERE \, см. ниже). (-E определяется POSIX.), Выбор соответствия
Это будет таблица "выхода" с:
0, выделенные строки найдены
1, в противном случае
2 произошла ошибка \, если не используется опция -q или --quiet или --silent и не найдена выбранная строка.
И так для каждого стандартного вида разделов справочной страницы.
И таблица с каждым текстом, который не был успешно помещен в какую-то другую таблицу.
Я надеюсь, что некоторую его часть будет легко проанализировать, например, создать таблицу параметров. Но какая-то другая часть будет довольно сложной, например, статус выхода. Вот почему я действительно хочу знать, что-то подобное уже сделано, чтобы не делать это самостоятельно.