Мой GPS-регистратор иногда оставляет «незаконченные» строки в конце файлов журнала. Я думаю, что они только в конце, но я хочу проверить все строки на всякий случай.
Примерное предложение выглядит следующим образом:
$GPRMC,005727.000,A,3751.9418,S,14502.2569,E,0.00,339.17,210808,,,A*76
Строка должна начинаться со знака $
и заканчиваться *
и двухсимвольной шестнадцатеричной контрольной суммой. Мне все равно, правильна ли контрольная сумма, просто она присутствует. Также необходимо игнорировать предложения "ADVER", которые не имеют контрольной суммы и находятся в начале каждого файла.
Может работать следующий код Python:
import re
from path import path
nmea = re.compile("^\$.+\*[0-9A-F]{2}$")
for log in path("gpslogs").files("*.log"):
for line in log.lines():
if not nmea.match(line) and not "ADVER" in line:
print "%s\n\t%s\n" % (log, line)
Есть ли способ сделать это с помощью grep
или awk
или чего-то простого? Я действительно не понял, как заставить grep
делать то, что я хочу.
Обновление : Спасибо @Motti и @Paul, я смог получить следующее, чтобы сделать почти то, что хотел, но мне пришлось использовать одинарные кавычки и удалить конечный $
, прежде чем он заработал:
grep -nvE '^\$.*\*[0-9A-F]{2}' *.log | grep -v ADVER | grep -v ADPMB
Возникают еще два вопроса: как я могу игнорировать пустые строки? И можно ли объединить последние два grep
с?