Допустим, я хочу очистить карту Neo4j RefCard, найденную на https://neo4j.com/docs/cypher-refcard/current/
И я хотел бы получить пример «кода» вместе с его стилем.Вот моя цель.Обратите внимание, что он имеет обработку CSS (шрифт, цвет ...).
... поэтому в Neo4j я вызываю apoc.load.htmlПроцедура, как показано здесь, и вы можете видеть, что нет проблем с поиском контента.
Возвращает карту с тремя ключами: tagName, атрибутами и текстом.
Текст является для меня проблемой.Это лишено всего моделирования.Я хотел бы, чтобы он дал мне больше информации о стилях различных частей этого текста.
Фактический HTML-код на веб-странице выглядит следующим образом со всеми этими тегами класса span: cm-string, cm-node, cm-atom и т. Д. Обратите внимание, что это не было сгенерировано в файле neo4j apoc.load.html.процедура.Это пришло прямо из консоли просмотра моего браузера Chrome.
Мне не нужны фактические шрифты и цвета, только имена тегов.
В документации 1037 * я вижу, что есть дополнительная карта конфигурации, которую вы можете предоставить.Но нет объяснения, что там можно настроить.Было бы замечательно, если бы я мог настроить его так, чтобы он возвращал, скажем, html, а не текст.
Библиотека, которую Neo4j использует для выбора CSS, здесь jsoup .
Поэтому я надеюсь не удалять теги span или иным образом извлекать их имена классов для каждого сегмента текста.