Два смежных поля отображаются как одно в XML с нераспознанным разделителем - как я могу разделить их в Google Sheets IMPORTXML? - PullRequest
0 голосов
/ 09 октября 2019

Я пытаюсь почистить список новостных статей на сайте, захватить тему, заголовок, автора и дату, опубликованные в Google Sheets, используя IMPORTXML. У меня есть первые два, но последние два сбиты с толку.

На сайте есть страница, где все его истории перечислены в хронологическом порядке. В источнике этой страницы автор и дата публикации отображаются в виде div:

By <span class="post-item-river__byline___mU1tP author vcard"><a class="byline-link url fn n" href="https://www.fakeurlgoeshere.com">Author Name</a></span><time class="post-item-river__date___1Dcq1 entry-date published" datetime="20XX-XX-XXTXX:XX:XX-XX:XX">Date Published</time>

Как это отображается на сайте: Имя автора · Дата публикации

Как это отображается при просмотрев IMPORTXML: Дата публикации автора

Я бы хотел, чтобы имя автора и время публикации были распознаны как отдельные поля. Как мне это сделать?

Я пытался использовать несколько аргументов, в том числе пробовал множество вариантов аргументов div / time, но, похоже, они не сработали, а вывод всегда возвращал «Импортированный контент пуст».

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...