Пожилой член семьи записал мемуары за последние несколько лет, используя Блокнот Windows, поэтому каждый файл (по годам) представляет собой простой текст. Мне поручено максимально нормализовать документы для последующего тиража. Проблема, с которой я борюсь, состоит в том, как обработать название каждой главы. В одном текстовом файле может быть несколько записей главы. некоторые названия глав очень просто получить, например:
Chapter 1
text
text
text.
chapter two
text
text
Но она не всегда была такой аккуратной. Некоторые из ее документов содержат строки типа
" chapter
three
"
с начальными и конечными пробелами и даже с CarriageReturn / LineFeed между ними.
Я не могу получить синтаксис для управления ситуацией "глава три". Вот что я сделал до сих пор:
$charstr = ' chapter
three
text here
more text
'
#remove leading spaces
$charstr2 = $charstr.trim()
#find and replace chapter to all caps and start on a new line
$charstr2.Replace("chapter ",''nCHAPTER ')
Я бы очень признателен за помощь в нормализации этой многострочной текстовой строки в такой формат, как «ГЛАВА три» (в идеале я буду ВЕРХНЕЙ () главу).
номер, например, «ГЛАВА ТРЕТЬЯ»).
Я пытался использовать \ s, как в
$ charstr2 = $ charstr.trim () -replace '\ s +',
но я явно что-то делаю не так.
Спасибо!
прочитать