найти дубликаты строк в Excel и экспортировать эти строки на другой лист с помощью Power Shell - PullRequest
0 голосов
/ 01 апреля 2019

Как найти повторяющиеся значения в Excel и экспортировать строки на другой лист с помощью Power Shell? enter image description here У меня был лист Excel с несколькими строками и столбцами, скажем, от «А» до «К». Мне нужно найти повторяющиеся строки, только если значения во всех столбцах в строке являются уникальными. И сценарий должен игнорировать столбцы D, E, F, даже если значения этих столбцов совпадают.

Скрипт также должен копировать все эти дублирующиеся строки и вставлять в новый файл Excel. Он также должен копировать строку заголовка и источник дублирующихся строк и также прикреплять образец изображения входного файла (выходной Файл также должен быть таким же, как ввод в этом случае ввода, поскольку он также должен копировать исходные дубликаты строк). Я пробовал код, но он выдает ошибку ... пожалуйста, посмотрите на это и дайте мне решение для кода.

code:
# The Text OleDB driver is only available in PowerShell x86. Start x86 
shell if using x64.
# This has to be the first check this script performs.
if ($env:Processor_Architecture -ne "x86")   { 
Write-Warning "Switching to x86 shell"
&"$env:windir\syswow64\windowspowershell\v1.0\powershell.exe" 
"$PSCommandPath $args"; return 
 }

# Change to your CSV file name, must end in .csv or .tsv
$csvfile = "C:\files\A01modcsv.csv"

 # Does the first row contain column names?
 $firstRowColumns = $True

 # What's the delimiter? Use `t for tabbed.
 $csvdelimter = "`t"


 $firstRowColumns = $true
 $checkColumns = "A"


 $datasource = Split-Path $csvfile
 $tablename = (Split-Path $csvfile -leaf).Replace(".","#")

 switch ($firstRowColumns) {
     $true { $firstRowColumns = "Yes" }
     $false { $firstRowColumns = "No" }
  }

 $elapsed = [System.Diagnostics.Stopwatch]::StartNew() 
 [void][Reflection.Assembly]::LoadWithPartialName("System.Data")

  # Setup OleDB using Microsoft Text Driver.
  $connstring = "Provider=Microsoft.Jet.OLEDB.4.0;Data Source=$datasource;Extended Properties='text;HDR=$firstRowColumns;FMT=Delimited($csvdelimter)';"

$conn = New-Object System.Data.OleDb.OleDbconnection
$conn.ConnectionString = $connstring
$conn.Open()
$cmd = New-Object System.Data.OleDB.OleDBCommand
$cmd.Connection = $conn


 # Perform select on CSV file, then add results to a datatable using ExecuteReader
 $sql = "SELECT $checkColumns, COUNT(*) as DupeCount FROM [$tablename] GROUP BY $checkColumns HAVING COUNT(*) > 1"
 $cmd.CommandText = $sql
 $dt = New-Object System.Data.DataTable
 $dt.BeginLoadData()
$dt.Load($cmd.ExecuteReader([System.Data.CommandBehaviour]::CloseConnection))
 $dt.EndLoadData()
 $totaltime = [math]::Round($elapsed.Elapsed.TotalSeconds,2)

 # Get Total Row Count

 $cmd.CommandText = "SELECT COUNT(*) as TotalRows FROM [$tablename]"
 $totalrows = $cmd.ExecuteScalar()
 $conn.Close()[enter image description here][1]

# Output some stats
$dupecount = $dt.Rows.Count
Write-Host "Total Elapsed Time: $totaltime seconds. $dupecount duplicates found out of $totalrows total rows. You can access these dupes using `$dt." -ForegroundColor Green

Я получаю сообщение об ошибке в указанном коде по команде "$ dt.Load ($ cmd.ExecuteReader ([System.Data.CommandBehaviour] :: CloseConnection))" .... может помочь мне решить эту ошибку . Спасибо.

...