Синтаксический анализ календаря с помощью REXML в Ruby - PullRequest
0 голосов
/ 06 февраля 2019

У меня есть задание в Ruby, где мне нужно прочитать HTML-документ, точнее календарь, и создавать объекты из датированных событий.В этом задании мне нужно использовать анализатор, и я решил использовать REXML (у нас было два варианта, и нет, Nokogiri там нет).

Я посмотрел на сайте REXML, чтобы найти этот биткода, используемого для чтения HTML-документов.Этот код не предназначен для выполнения вышеупомянутого задания, а просто распечатывает результаты.Это хорошее начало.

требуется "rexml / document"

file = File.new ("events.html")

doc = REXML :: Document.new file

doc.elements.each ("body") {| element |put element.attributes ['block']}

Вы можете игнорировать биты "body" и "block".Тело - это где / какие элементы (я не эксперт по терминологии), а «блок» - это то, что я хочу найти в элементах.Вот ссылка на HTML-документ.https://www.ida.liu.se/~TDP007/material/seminarie2/events.html Как вы можете видеть, этот документ не так прост, как просто .each («Элемент / Blablabla»).Я совсем не уверен, что туда поместить и найти нужные мне события календаря.

Кто-нибудь знает, что поставить вместо "body" и "block", чтобы найти их?

Если в моем вопросе отсутствует какая-либо информация, скажите мне.Я могу предоставить файлы, если это необходимо, но на самом деле ничего такого нет.

...