Мне нужно заменить несколько пробелов в один пробел (на одну итерацию) в документе. Неважно, являются ли они пробелами, табуляциями или символами новой строки, любая комбинация любых пробелов должна быть усечена до единого пробела.
Допустим, у нас есть строка: "Hello, \ t \ t \ n \ t \ n world", (где \ t и \ n представляют вкладки и символы новой строки соответственно), тогда мне нужно, чтобы она стала "Hello, мир».
Я настолько сбит с толку регулярным выражением, что я просто спросил.
Вопросы:
У меня нет контроля над документом, поскольку это может быть любой документ в Интернете.
Я использую C #, так что, если кто-нибудь знает, как это сделать конкретно в C #, это было бы еще более круто.
Мне на самом деле не нужно использовать регулярное выражение (прежде чем кто-то спросит), но я подумал, что это, вероятно, оптимальный способ, так как регулярное выражение предназначено для такого рода вещей, и мой собственный суп strpos / str_replace / substr будет вероятно, не так хорошо. Для этого важна производительность, поэтому то, что я в основном ищу, это эффективный способ сделать это для любого произвольного текстового файла в Интернете (помните, я не могу предсказать размер!).
Заранее спасибо!
- Хельги