Замена подстрок с помощью регулярного выражения в powershell - PullRequest
1 голос
/ 29 марта 2019

В моем PowerShell есть следующий код регулярного выражения для определения URL-адресов, которые необходимо обновить:

'href[\s]?=[\s]?\"[^"]*(https:\/\/oursite.org\/[^"]*News and Articles[^"]*)+\"'
'href[\s]?=[\s]?\"[^"]*(https:\/\/oursite.org\/[^"]*en\/News-and-Articles[^"]*)+\"'

Это дает мне результаты, которые мне нужно обновить, теперь мне нужно знать, как заменить значения «Новости и статьи» на «новости и статьи» и «en» на «новости и статьи».

У меня есть код, который имеет заменяющий URL, например:

$newUrl = 'href="https://oursite.org/"' #replaced value 

Итак, начальный результат будет:

https://www.oursite.org/en/News-and-Articles/2017/11/article-name

подлежит замене на

https://www.oursite.org/news-and-articles/2017/11/article-name

Вот функция, которая просматривает все статьи и выполняет замену:

   function SearchItemForMatch
{
    param(
        [Data.Items.Item]$item
        )
    Write-Host "------------------------------------item: " $item.Name
    foreach($field in $item.Fields) {
        #Write-Host $field.Name
        if($field.Type -eq "Rich Text") {
            #Write-Host $field.Name
            if($field.Value -match $pattern) {
                ReplaceFieldValue -field $field -needle $pattern -replacement $newUrl
            }
            #if($field.Value -match $registrationPattern) {
            #   ReplaceFieldValue -field $field -needle $registrationPattern -replacement $newRegistrationUrl
            #}
            if($field.Value -match $noenpattern){
                ReplaceFieldValue -field $field -needle $noenpattern -replacment $newnoenpattern
            }
        }
    }
}

Вот метод замены:

 Function ReplaceFieldValue
    {
        param (
            [Data.Fields.Field]$field,
            [string]$needle,
            [string]$replacement
            )

        Write-Host $field.ID
        $replaceValue = $field.Value -replace $needle, $replacement
        $item = $field.Item
        $item.Editing.BeginEdit()
        $field.Value = $replaceValue
        $item.Editing.EndEdit()
        Publish-Item -item $item -PublishMode Smart

        $info = [PSCustomObject]@{
            "ID"=$item.ID
            "PageName"=$item.Name
            "TemplateName"=$item.TemplateName
            "FieldName"=$field.Name
            "Replacement"=$replacement
        }
        [void]$list.Add($info)
    }

Ответы [ 2 ]

0 голосов
/ 29 марта 2019

Простите, если я что-то упустил, но мне кажется, что все, чего вы действительно хотите достичь, - это избавиться от части /en и, наконец, преобразовать весь URL в нижний регистр.

Учитывая ваш пример URL, это может быть так просто, как:

$url = 'https://www.oursite.org/en/News-and-Articles/2017/11/article-name'
$replaceValue = ($url -replace '/en/', '/').ToLower()

Результат:

https://www.oursite.org/news-and-articles/2017/11/article-name

Если это требует более сложных замен, тогда, пожалуйста, отредактируйте свой вопрос и дайте нам больше примеров и желаемых результатов.

0 голосов
/ 29 марта 2019

Попробуйте Regex: (?<=oursite\.org\/)(?:en\/)?News-and-Articles(?=\/)

Замените на news-and-articles

Демо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...