Я пытаюсь разобрать простую HTML-страницу с pup .
Это синтаксический анализатор командной строки HTML, который принимает общие селекторы HTML.
Я хочу выбрать:
'div.aclass text{}' #(would be SampleA)
и я также хочу выбрать:
'div.bclass text{}' #(would be SampleB)
и я хочу объединить их и вставить некоторый пользовательский текст, чтобы получить:
SampleA;MYEXTRASTRING;SampleB
Я хочу избегать называть щенка несколько раз, потому что это медленно.
Я могу выбрать несколько тегов:
'div.aclass text{}, div.bclass text{}'
но это приведет к:
SampleA
SampleB
Есть ли лучший выбор, чем щенок для этой цели?
(Примечание: Python НЕ является опцией, поскольку он очень медленный для моих нужд.)