Я пытаюсь почистить список новостных статей на сайте, захватить тему, заголовок, автора и дату, опубликованные в Google Sheets, используя IMPORTXML. У меня есть первые два, но последние два сбиты с толку.
На сайте есть страница, где все его истории перечислены в хронологическом порядке. В источнике этой страницы автор и дата публикации отображаются в виде div:
By <span class="post-item-river__byline___mU1tP author vcard"><a class="byline-link url fn n" href="https://www.fakeurlgoeshere.com">Author Name</a></span><time class="post-item-river__date___1Dcq1 entry-date published" datetime="20XX-XX-XXTXX:XX:XX-XX:XX">Date Published</time>
Как это отображается на сайте: Имя автора · Дата публикации
Как это отображается при просмотрев IMPORTXML: Дата публикации автора
Я бы хотел, чтобы имя автора и время публикации были распознаны как отдельные поля. Как мне это сделать?
Я пытался использовать несколько аргументов, в том числе пробовал множество вариантов аргументов div / time, но, похоже, они не сработали, а вывод всегда возвращал «Импортированный контент пуст».