В скрипте PowerShell я читаю файл CSV.
Мне нужно «исправить» некоторые значения. В частности, CSV может содержать либо пустое значение, либо буквально NULL
, либо иногда -
. Все эти значения должны рассматриваться как $null
.
Есть ли способ перехватить анализ CSV для обработки этого?
На самом деле у меня есть рабочее решение, но решение ужасно медленно . Повторение более 2500 элементов занимает 20 минут, а чтение как CSV-файла занимает всего несколько секунд.
Идея состоит в том, чтобы перебрать все свойства:
$private:result = @{}
foreach($private:prop in $private:line.PSObject.Properties){
$private:value = $null
$private:result.Add($private:prop.Name, ($private:value | Filter-Value))
}
$private:result
...
function Filter-Value{
param(
[Parameter(Position=0, ValueFromPipeline=$true)]
[object]$In
)
if(-not $In){
$null
}
elseif(($In -is [string]) -and ($In.Length -eq 0)) {
$null
}
elseif(($In -eq "NULL") -or ($In -eq "-")) {
$null
}
else{
$In
}
}
Полный код:
function Import-CsvEx{
param(
[Parameter(Mandatory=$true, Position=0, ValueFromPipeline=$true)]
[ValidateScript({Test-Path $_ -PathType Leaf})]
[string]$Path,
[Parameter()]
[string]$Delimiter
)
begin{
Write-Verbose "Begin read of file $Path"
}
process{
# We use file stream and stream reader to automatically detect encoding
$private:fileStream = [System.IO.File]::OpenRead($Path)
$private:streamReader = New-Object System.IO.StreamReader($private:fileStream, [System.Text.Encoding]::Default, $true)
$private:fileContent = $private:streamReader.ReadToEnd()
$private:streamReader.Dispose()
$private:fileStream.Dispose()
$private:csv = ConvertFrom-Csv $private:fileContent -Delimiter $Delimiter
for($private:i=0; $private:i -lt $private:csv.Count ; $private:i++){
Write-Progress -Id 1003 -Activity "Reading CSV" -PercentComplete ($private:i*100/$private:csv.count)
$private:line = $private:csv[$private:i]
$private:result = @{}
foreach($private:prop in $private:line.PSObject.Properties){
$private:value = $null
$private:result.Add($private:prop.Name, ($private:value | Filter-Value))
}
# actually outputs the object to the pipeline
New-Object psobject -Property $private:result
}
Write-Progress -Id 1003 -Activity "Reading CSV" -Completed
}
end{
Write-Verbose "End read of file $Path"
}
}
function Filter-Value{
param(
[Parameter(Position=0, ValueFromPipeline=$true)]
[object]$In
)
if(-not $In){
$null
}
elseif(($In -is [string]) -and ($In.Length -eq 0)) {
$null
}
elseif(($In -eq "NULL") -or ($In -eq "-")) {
$null
}
else{
$In
}
}