Powershell - синтаксический анализ файла ATOM RSS - PullRequest
0 голосов
/ 12 апреля 2020

[Пример файла rss] [1]

Я пытаюсь проанализировать файл RSS с веб-сайта. Файл RSS имеет rss.channel.item et c. Я могу разобрать все, кроме "описание". Он продолжает возвращать теги HTML, и я хочу иметь возможность получить внутри текст, который содержит информацию о том, кто он, затронутые области и описание события. Я хотел бы отформатировать все, чтобы показать правильный заголовок, информацию и так далее.

Есть идеи, как выполнить эту задачу?

Код:

cls
Invoke-WebRequest -Uri "" -outfile c:\""
[xml]$content = get-content c:\""
$feed = $content.rss.channel
foreach ($msg in $feed.item) {
[PSCustomObject]@{
'Date-Time' = [datetime]$msg.pubDate
'Title' = $msg.link.InnerText
'description' = $msg.description.InnerText
}}

Пример файла rss:

<item>
<title>Account Management Planned Outage</title>
<link><![CDATA[https://*.service-now.*/sp?id=service_status&service=5569a0344ffe72487e415cd01310c72e]]></link>
<pubDate>06 Apr 2020 11:51:42 -0400</pubDate>
<guid isPermaLink="false">014451c11b0c54547746766dcc4bcb96</guid>
<description><![CDATA[<p><strong>People and Locations Impacted:     </strong><br />All students, faculty, staff at all State locations<br /><br /><strong>IT Service(s) Impacted:</strong>
<br />Enterprise Directory services: ldap.*.edu, dirapps.*.*.edu, and ldap-prime.*.*.edu. No outages will occur, but services will be restarted.<br /><br /><strong>Date and Time:</strong><br />Services may be affected from 05:30ET until 06:59ET on Tuesday, 04/07/2020.<br />
<br /><strong>Technical Information:</strong><br />This alert will be  updated as new information becomes available. State IT users can view additional details in ServiceNow.</p>]]></description>

...