Я пытаюсь разобрать запись Викисловаря, чтобы получить все определения на английском языке. Я могу восстановить все определения, проблема в том, что некоторые определения на других языках. Что я хотел бы сделать, так это каким-то образом получить только HTML-блок с английскими определениями. Я обнаружил, что в случае, когда есть записи на других языках, заголовок после английских определений может быть получен с помощью:
header = (doc/"h2")[3]
Так что я хотел бы искать только все элементы перед этим элементом заголовка. Я думал, что это возможно с header.preceding_siblings()
, но, похоже, это не работает. Есть предложения?