Самая большая проблема в вашем существующем коде - это то, что SetLocal enableDelayedExpansion
неправильно написано - оно должно быть в цикле после set str=%%I
.
Другие проблемы:
- будет убирать строкиначиная с;
- удалит начальные пробелы из каждой строки
- удалит пустые (пустые) строки
- выведет
ECHO is off
, если какие-либо строки станут пустыми или будут содержать только пробелы послезамена - добавит дополнительное пространство в конце каждой строки (не замечал этого, пока я не прочитал ответ Джеба)
Проблема оптимизации - использование >>
может быть относительно медленным.Быстрее заключить весь цикл в (), а затем использовать >
Ниже приведено лучшее из того, что вы можете сделать с помощью пакета Windows.Я автоматически назвал выходные данные в соответствии с запросом, сделав одно лучше - он автоматически сохраняет расширение исходного имени.
@echo off
SetLocal
cd /d %~dp0
Set "OldString=[HFloat(undefined),HFloat(undefined),HFloat(undefined)],"
Set "NewString="
set file="test.mpl"
for %%F in (%file%) do set outFile="%%~nFCleaned%%~xF"
pause
(
for /f "skip=2 delims=" %%a in ('find /n /v "" %file%') do (
set "ln=%%a"
setlocal enableDelayedExpansion
set "ln=!ln:*]=!"
if defined ln set "ln=!ln:%OldString%=%NewString%!"
echo(!ln!
endlocal
)
)>%outFile%
Известные ограничения
- ограничено чуть менее 8k на строку,как до, так и после подстановки
- строка поиска не может содержать
=
или !
, а также не может начинаться с *
или ~
- строка замены не может содержать
!
- поиск в части поиска и замены не учитывает регистр
- последняя строка всегда будет заканчиваться символом новой строки
<CR><LF>
, даже если оригинал не
Все, кроме первого ограничения, могут бытьустранено, но это потребует большого количества кода и будет ужасно медленным.Решение потребовало бы посимвольного поиска каждой строки.Последнее ограничение потребовало бы некоторого неловкого теста, чтобы определить, была ли последняя строка завершена новой строкой, а затем последнюю строку нужно было бы напечатать, используя <nul SET /P "ln=!ln!"
трюк, если новая строка не нужна.
Интересная функция (или ограничение, в зависимости отв перспективе)
- Файлы стилей Unix, заканчивающиеся строками
<LF>
, будут преобразованы в стиль Windows со строками, заканчивающимися <CR><LF>
Существуют и другие решения, использующие пакетныезначительно быстрее, но все они имеют больше ограничений.
Обновление - я опубликовал новое чистое пакетное решение, которое способно выполнять поиск с учетом регистра и не имеет ограничений на поиск или замену содержимого строки.Он имеет больше ограничений по длине строки, конечным управляющим символам и формату строки.Производительность неплохая, особенно если количество замен низкое. http://www.dostips.com/forum/viewtopic.php?f=3&t=2710
Приложение
На основе приведенных ниже комментариев пакетное решение не будет работатьдля этой конкретной проблемы из-за ограничения длины строки.
Но этот код является хорошей основой для утилиты поиска и замены на основе пакета, если вы готовы мириться с ограничениями и относительно низкой производительностью пакета.
Доступны гораздо лучшие инструменты для обработки текста, хотя они не являются стандартными для Windows.Мой фаворит - sed в пакете GNU Utilities для Win32 .Утилиты бесплатны и не требуют никакой установки.
Вот решение sed для Windows с использованием утилит GNU
@echo off
setlocal
cd /d %~dp0
Set "OldString=\[HFloat(undefined),HFloat(undefined),HFloat(undefined)\],"
Set "NewString="
set file="test.mpl"
for %%F in (%file%) do set outFile="%%~nFCleaned%%~xF"
pause
sed -e"s/%OldString%/%NewString%/g" <%file% >%outfile%
Обновление 2013-02-19
sed не может быть вариантом, если вы работаете на сайте, где действуют правила, запрещающие установку исполняемых файлов, загружаемых из Интернета.
JScriptимеет хорошую обработку регулярных выражений, и это стандартно для всех современных платформ Windows, включая XP.Это хороший выбор для выполнения операций поиска и замены на платформах Windows.
Я написал гибридный сценарий поиска и замены JScript / Batch (REPL.BAT), который легко вызывать из пакетного сценария.Небольшое количество кода дает много мощных функций;не такой мощный, как sed, но более чем достаточно для решения этой задачи, как и многие другие.Это также довольно быстро, намного быстрее, чем любое чистое пакетное решение.Он также не имеет никаких ограничений по длине строки.
Вот пакетный скрипт, который использует мою утилиту REPL.BAT для выполнения задачи.
@echo off
setlocal
cd /d %~dp0
Set "OldString=[HFloat(undefined),HFloat(undefined),HFloat(undefined)],"
Set "NewString="
set file="test.txt"
for %%F in (%file%) do set outFile="%%~nFCleaned%%~xF"
pause
call repl OldString NewString le <%file% >%outfile%
Я использую опцию L
для указания литеральной строки поиска вместо регулярного выражения и опцию E
для передачи поиска и замены строк через переменные среды по имени вместо использования строковых литералов в командной строке .
Вот служебный скрипт REPL.BAT, который вызывает приведенный выше код. Полная документация включена в скрипт.
@if (@X)==(@Y) @end /* Harmless hybrid line that begins a JScript comment
::************ Documentation ***********
:::
:::REPL Search Replace [Options [SourceVar]]
:::REPL /?
:::
::: Performs a global search and replace operation on each line of input from
::: stdin and prints the result to stdout.
:::
::: Each parameter may be optionally enclosed by double quotes. The double
::: quotes are not considered part of the argument. The quotes are required
::: if the parameter contains a batch token delimiter like space, tab, comma,
::: semicolon. The quotes should also be used if the argument contains a
::: batch special character like &, |, etc. so that the special character
::: does not need to be escaped with ^.
:::
::: If called with a single argument of /? then prints help documentation
::: to stdout.
:::
::: Search - By default this is a case sensitive JScript (ECMA) regular
::: expression expressed as a string.
:::
::: JScript syntax documentation is available at
::: http://msdn.microsoft.com/en-us/library/ae5bf541(v=vs.80).aspx
:::
::: Replace - By default this is the string to be used as a replacement for
::: each found search expression. Full support is provided for
::: substituion patterns available to the JScript replace method.
::: A $ literal can be escaped as $$. An empty replacement string
::: must be represented as "".
:::
::: Replace substitution pattern syntax is documented at
::: http://msdn.microsoft.com/en-US/library/efy6s3e6(v=vs.80).aspx
:::
::: Options - An optional string of characters used to alter the behavior
::: of REPL. The option characters are case insensitive, and may
::: appear in any order.
:::
::: I - Makes the search case-insensitive.
:::
::: L - The Search is treated as a string literal instead of a
::: regular expression. Also, all $ found in Replace are
::: treated as $ literals.
:::
::: E - Search and Replace represent the name of environment
::: variables that contain the respective values. An undefined
::: variable is treated as an empty string.
:::
::: M - Multi-line mode. The entire contents of stdin is read and
::: processed in one pass instead of line by line. ^ anchors
::: the beginning of a line and $ anchors the end of a line.
:::
::: X - Enables extended substitution pattern syntax with support
::: for the following escape sequences:
:::
::: \\ - Backslash
::: \b - Backspace
::: \f - Formfeed
::: \n - Newline
::: \r - Carriage Return
::: \t - Horizontal Tab
::: \v - Vertical Tab
::: \xnn - Ascii (Latin 1) character expressed as 2 hex digits
::: \unnnn - Unicode character expressed as 4 hex digits
:::
::: Escape sequences are supported even when the L option is used.
:::
::: S - The source is read from an environment variable instead of
::: from stdin. The name of the source environment variable is
::: specified in the next argument after the option string.
:::
::************ Batch portion ***********
@echo off
if .%2 equ . (
if "%~1" equ "/?" (
findstr "^:::" "%~f0" | cscript //E:JScript //nologo "%~f0" "^:::" ""
exit /b 0
) else (
call :err "Insufficient arguments"
exit /b 1
)
)
echo(%~3|findstr /i "[^SMILEX]" >nul && (
call :err "Invalid option(s)"
exit /b 1
)
cscript //E:JScript //nologo "%~f0" %*
exit /b 0
:err
>&2 echo ERROR: %~1. Use REPL /? to get help.
exit /b
************* JScript portion **********/
var env=WScript.CreateObject("WScript.Shell").Environment("Process");
var args=WScript.Arguments;
var search=args.Item(0);
var replace=args.Item(1);
var options="g";
if (args.length>2) {
options+=args.Item(2).toLowerCase();
}
var multi=(options.indexOf("m")>=0);
var srcVar=(options.indexOf("s")>=0);
if (srcVar) {
options=options.replace(/s/g,"");
}
if (options.indexOf("e")>=0) {
options=options.replace(/e/g,"");
search=env(search);
replace=env(replace);
}
if (options.indexOf("l")>=0) {
options=options.replace(/l/g,"");
search=search.replace(/([.^$*+?()[{\\|])/g,"\\$1");
replace=replace.replace(/\$/g,"$$$$");
}
if (options.indexOf("x")>=0) {
options=options.replace(/x/g,"");
replace=replace.replace(/\\\\/g,"\\B");
replace=replace.replace(/\\b/g,"\b");
replace=replace.replace(/\\f/g,"\f");
replace=replace.replace(/\\n/g,"\n");
replace=replace.replace(/\\r/g,"\r");
replace=replace.replace(/\\t/g,"\t");
replace=replace.replace(/\\v/g,"\v");
replace=replace.replace(/\\x[0-9a-fA-F]{2}|\\u[0-9a-fA-F]{4}/g,
function($0,$1,$2){
return String.fromCharCode(parseInt("0x"+$0.substring(2)));
}
);
replace=replace.replace(/\\B/g,"\\");
}
var search=new RegExp(search,options);
if (srcVar) {
WScript.Stdout.Write(env(args.Item(3)).replace(search,replace));
} else {
while (!WScript.StdIn.AtEndOfStream) {
if (multi) {
WScript.Stdout.Write(WScript.StdIn.ReadAll().replace(search,replace));
} else {
WScript.Stdout.WriteLine(WScript.StdIn.ReadLine().replace(search,replace));
}
}
}