У меня есть файл, который выглядит так:
<text top="123" left="45" width="50" height="17" font="8">Måndag</text>
Как отмечено в теме, этот файл кодируется в utf-8. При использовании этой команды:
cat file | sed 's_.*top="\([0-9][0-9]*\)" left="\([0-9][0-9]*\)".*>\(.*\)<.*_\1 \2 \3_'
никогда не завершает выполнение и ничего не печатает.
Однако, выполняя такую строку:
cat file | sed 's/å/FOO/'
дает мне правильный вывод:
<text top="123" left="45" width="50" height="17" font="8">MFOOndag</text>
Это ошибка в sed или что-то не так с моим регулярным выражением или тем, как я его использую? Мне нужен аккуратный способ извлечения верхних, левых и контентных данных без использования слишком большого количества команд.