Чтобы создать новый столбец из HTML с каждой ссылкой в одной ячейке, разделенной новой строкой:
forEach(value.parseHtml().select('a'), e, e).join('\n')
Вы должны увидеть что-то вроде этого:
Или, если вам нужен только текст ссылок:
forEach(value.parseHtml().select('a'), e, e.htmlText()).join('\n')
Или, если вы хотите только URL:
forEach(value.parseHtml().select('a'), e, e.htmlAttr('href')).join('\n')
Создатьновый столбец из HTML, который подсчитывает количество ссылок:
forEach(value.parseHtml().select('a'), e, e).length()
В вашем образце нет изображения или видео, поэтому я не могу показать вам, как их найти.Чтобы извлечь ссылки на infogr.am:
forEach(value.parseHtml().select('iframe[src*=infogr.am]'), e, e.htmlAttr('src')).join('\n')
OpenRefine использует селекторы JSoup , которые очень похожи на селекторы CSS.Просто используйте правый селектор внутри функции .select()
.