При использовании apoc.load.html, возможно ли вернуть полный HTML, а не только текст? - PullRequest
0 голосов
/ 07 декабря 2018

Допустим, я хочу очистить карту Neo4j RefCard, найденную на https://neo4j.com/docs/cypher-refcard/current/

И я хотел бы получить пример «кода» вместе с его стилем.Вот моя цель.Обратите внимание, что он имеет обработку CSS (шрифт, цвет ...).

enter image description here

... поэтому в Neo4j я вызываю apoc.load.htmlПроцедура, как показано здесь, и вы можете видеть, что нет проблем с поиском контента.

enter image description here

Возвращает карту с тремя ключами: tagName, атрибутами и текстом.

enter image description here

Текст является для меня проблемой.Это лишено всего моделирования.Я хотел бы, чтобы он дал мне больше информации о стилях различных частей этого текста.

Фактический HTML-код на веб-странице выглядит следующим образом со всеми этими тегами класса span: cm-string, cm-node, cm-atom и т. Д. Обратите внимание, что это не было сгенерировано в файле neo4j apoc.load.html.процедура.Это пришло прямо из консоли просмотра моего браузера Chrome.

enter image description here

Мне не нужны фактические шрифты и цвета, только имена тегов.

В документации 1037 * я вижу, что есть дополнительная карта конфигурации, которую вы можете предоставить.Но нет объяснения, что там можно настроить.Было бы замечательно, если бы я мог настроить его так, чтобы он возвращал, скажем, html, а не текст.

enter image description here

Библиотека, которую Neo4j использует для выбора CSS, здесь jsoup .

Поэтому я надеюсь не удалять теги span или иным образом извлекать их имена классов для каждого сегмента текста.

1 Ответ

0 голосов
/ 07 декабря 2018

Не могли бы вы сами сгенерировать HTML из свойств вашего объекта?Похоже, что все они являются тегами span с 3 различными классами, в зависимости от того, используете ли вы имя свойства, значение свойства или разделитель свойства?

Вероятно, именно так они сами генерируют HTML.

...