извлечь номер из строки - PullRequest
2 голосов
/ 21 апреля 2011

У меня есть строка ABCD20110420.txt, и я хочу извлечь из нее дату. Ожидаемый 2011-04-20 Я могу использовать замену, чтобы удалить текстовую часть, но как мне вставить «-»?

# echo "ABCD20110420.txt" | replace 'ABCD' '' | replace '.txt' ''
20110420

Ответы [ 5 ]

4 голосов
/ 21 апреля 2011

echo "ABCD20110420.txt" | sed -e 's/ABCD//' -e 's/.txt//' -e 's/\(....\)\(..\)\(..\)/\1-\2-\3/'

Читать: sed FAQ

4 голосов
/ 21 апреля 2011

Просто используйте оболочку (bash)

$> file=ABCD20110420.txt
$> echo "${file//[^0-9]/}"
20110420
$> file="${file//[^0-9]/}"
$> echo $file
20110420
$> echo ${file:0:4}-${file:4:2}-${file:6:2}
2011-04-20

Вышеуказанное применимо к файлам, таким как ваш образец. Если у вас есть файлы типа A1BCD20110420.txt, то работать не будет.

Для этого случая

$> file=A1BCD20110420.txt    
$> echo ${file%.*} #get rid of .txt
A1BCD20110420
$> file=${file%.*}
$> echo "2011${file#*2011}"
20110420

Или вы можете использовать регулярное выражение (Bash 3.2 +)

$> file=ABCD20110420.txt
$> [[ $file =~ ^.*(2011)([0-9][0-9])([0-9][0-9])\.*$ ]]
$> echo ${BASH_REMATCH[1]}
2011
$> echo ${BASH_REMATCH[2]}
04
$> echo ${BASH_REMATCH[3]}
20
1 голос
/ 21 апреля 2011
echo "ABCD20110420.txt" | sed -r 's/.+([0-9]{4})([0-9]{2})([0-9]{2}).+/\1-\2-\3/'
0 голосов
/ 21 апреля 2011
echo "ABCD20110420.txt" | sed -r 's/.{4}(.{4})(.{2})(.{2}).txt/\1-\2-\3/'
0 голосов
/ 21 апреля 2011
$ file=ABCD20110420.txt
$ echo "$file" | sed -e 's/^[A-Za-z]*\([0-9][0-9][0-9][0-9]\)\([0-9][0-9]\)\([0-9][0-9]\)\.txt$/\1-\2-\3/'

Для этого требуется только один вызов sed.

...