Удалить конкретные номера строк из текстового файла, используя sed? - PullRequest
208 голосов
/ 21 января 2010

Я хочу удалить один или несколько конкретных номеров строк из файла. Как бы я сделал это с помощью sed?

Ответы [ 6 ]

332 голосов
/ 21 января 2010

Если вы хотите удалить строки с 5 по 10 и 12:

sed -e '5,10d;12d' file

Это выведет результаты на экран. Если вы хотите сохранить результаты в одном файле:

sed -i.bak -e '5,10d;12d' file

Это вернет файл до file.bak и удалит указанные строки.

Примечание. Номера строк начинаются с 1. Первая строка файла - 1, а не 0.

38 голосов
/ 25 июля 2014

Вы можете удалить отдельную строку с ее номером sed -i '33d' file

Это удалит строку с номером 33 и сохранит обновленный файл.

25 голосов
/ 22 января 2010

и awk, а также

awk 'NR!~/^(5|10|25)$/' file
16 голосов
/ 21 января 2010
$ cat foo
1
2
3
4
5
$ sed -e '2d;4d' foo
1
3
5
$ 
6 голосов
/ 28 июля 2016

Это очень часто является признаком антипаттерна. Инструмент, который произвел номера строк, вполне может быть заменен инструментом, который сразу удаляет строки. Например;

grep -nh error logfile | cut -d: -f1 | deletelines logfile

(где deletelines - нужная вам утилита) - то же, что и

grep -v error logfile

Сказав, что, если вы находитесь в ситуации, когда вам действительно нужно выполнить эту задачу, вы можете сгенерировать простой сценарий sed из файла номеров строк. Смешно (но, возможно, слегка запутанно) вы можете сделать это с sed.

sed 's%$%d%' linenumbers

Принимает файл номеров строк, по одному на строку, и выдает на стандартном выходе те же номера строк с d, добавляемыми после каждого. Это действительный сценарий sed, который мы можем сохранить в файл или (на некоторых платформах) направить в другой экземпляр sed:

sed 's%$%d%' linenumbers | sed -f - logfile

На некоторых платформах sed -f не понимает аргумент опции - для обозначения стандартного ввода, поэтому вам нужно перенаправить скрипт во временный файл и очистить его, когда вы закончите, или, возможно, заменить одинокий тире с /dev/stdin или /proc/$pid/fd/1, если ваша ОС (или оболочка) имеет это.

Как всегда, вы можете добавить -i перед параметром -f, чтобы sed отредактировал целевой файл на месте, вместо получения результата на стандартном выводе. На платформах * BSDish (включая OSX) вам также необходимо указать явный аргумент для -i; распространенная идиома - предоставить пустой аргумент; -i ''.

2 голосов
/ 24 апреля 2014

Я хотел бы предложить обобщение с помощью awk.

Когда файл составлен из блоков фиксированного размера и строки для удаления повторяются для каждого блока, awk может нормально работать таким образом

awk '{nl=((NR-1)%2000)+1; if ( (nl<714) || ((nl>1025)&&(nl<1029)) ) print  $0}'
 OriginFile.dat > MyOutputCuttedFile.dat

В этом примере размер блока равен 2000, и я хочу напечатать строки [1..713] и [1026..1029].

  • NR - это переменная, используемая awk для хранения текущего номера строки.
  • % дает остаток (или модуль) деления двух целых чисел;
  • nl=((NR-1)%BLOCKSIZE)+1 Здесь мы записываем в переменную nl номер строки внутри текущего блока. (см. ниже)
  • || и && являются логическими операторами ИЛИ и И .
  • print $0 пишет полную строку

Why ((NR-1)%BLOCKSIZE)+1:
(NR-1) We need a shift of one because 1%3=1, 2%3=2, but 3%3=0.
  +1   We add again 1 because we want to restore the desired order.

+-----+------+----------+------------+
| NR  | NR%3 | (NR-1)%3 | (NR-1)%3+1 |
+-----+------+----------+------------+
|  1  |  1   |    0     |     1      |
|  2  |  2   |    1     |     2      |
|  3  |  0   |    2     |     3      |
|  4  |  1   |    0     |     1      |
+-----+------+----------+------------+

...