Страница Man, как структурированные данные (CSV, база данных, ...) - PullRequest
0 голосов
/ 05 мая 2018

Чтобы упростить мой вопрос, я в основном рассматриваю справочные страницы команд. например, «человек grep». Страницы руководства более или менее структурированы. Большинство разделов и их представление являются стандартными, а объяснение можно найти на https://www.tldp.org/HOWTO/Man-Page/q3.html (И источник справочной страницы, в groff, понять не сложно, даже не зная groff)

Мой вопрос: есть ли уже база данных с (более стандартными) справочными страницами. Или, по крайней мере, программу, принимающую в качестве входных данных страницу руководства (вероятно, в виде файла groff) и выводящую такую ​​базу данных. Здесь я имею в виду базу данных в очень смутном смысле. Sqlite или MySQL были бы идеальными. Но почтовый индекс csv также был бы великолепен. Позвольте мне привести пример использования команды grep.

База данных будет иметь таблицу параметров с записью для каждого параметра. Эта запись будет содержать: - фактические названия опций - Аббревиатура (ы), - описание того, что делает эта опция - Секция ограждения. , В CSV запись будет --extended-regexp, -E, интерпретировать PATTERN как расширенное регулярное выражение (ERE \, см. ниже). (-E определяется POSIX.), Выбор соответствия

Это будет таблица "выхода" с: 0, выделенные строки найдены 1, в противном случае 2 произошла ошибка \, если не используется опция -q или --quiet или --silent и не найдена выбранная строка.

И так для каждого стандартного вида разделов справочной страницы. И таблица с каждым текстом, который не был успешно помещен в какую-то другую таблицу.

Я надеюсь, что некоторую его часть будет легко проанализировать, например, создать таблицу параметров. Но какая-то другая часть будет довольно сложной, например, статус выхода. Вот почему я действительно хочу знать, что-то подобное уже сделано, чтобы не делать это самостоятельно.

1 Ответ

0 голосов
/ 05 мая 2018

Вы можете скачать справочные страницы с git clone http://git.kernel.org/pub/scm/docs/man-pages/man-pages

...