Вы можете хотеть токенизировать текст по пробелам:
grep -o '[^[:space:]][^[:space:]]*' mytext.txt > output.txt
grep -o '[^[:space:]]\{1,\}' mytext.txt > output.txt
grep -oE '[^[:space:]]+' mytext.txt > output.txt
Или вы можете извлечь все куски из 1+ букв (\p{L}
), диакритических знаков (\p{M}
) и цифр (\p{N}
)) с регулярным выражением PCRE, например:
grep -oP '[\p{L}\p{M}\p{N}]+' mytext.txt > output.txt
См. онлайн-демонстрацию . Для этого вам понадобится pcregrep
на MacOS.