Я только начал читать графическую теорию и структуры данных.
Я создаю пример приложения, которое должно быть в состоянии найти xpath для наиболее распространенных ссылок. Представьте себе Google Serp, мое приложение должно найти xpath для всех ссылок, указывающих на результат.
Представьте, что эти xpaths были найдены:
/html/body/h2/a
/html/body/p/a
/html/body/p/strong/a
/html/body/p/strong/a
/html/body/p/strong/a
/html/body/div[@class=footer]/span[@id=copyright]/a
Из этих xpats я подумал о графике, подобном этому (я мог бы быть совершенно потерян здесь):
html
|
body
h2 - p - div[@class=footer]
| | |
a (1) a - strong span[@id=copyright]
| |
a (3) a (1)
Это лучший подход к этой проблеме?
Каков наилучший способ (структура данных) для сохранения этого в памяти? Язык не имеет значения. Мы видим, что у нас есть 3 ссылки, соответствующие пути html -> body -> p -> strong -> a.
Как я уже сказал, я совершенно новичок в этом, поэтому, пожалуйста, прости меня, если я подумал об этом совершенно неправильно.
РЕДАКТИРОВАТЬ : Возможно, я ищу структуру данных три?