Это удалит все, оканчивающееся на .com
или .org
:
sed 's/\s\?\w\+\.\(com\|org\)//g' foo.txt
.здесь это в стандарте POSIX.Я также добавил еще несколько символов, чтобы соответствовать случаям, когда могут быть субдомены или протоколы (http://
)
sed 's/[[:space:]]\?[A-Za-z0-9_\/\:\.-]\+\.\(com\|org\)//g' foo.txt
Также обратите внимание, что это не охватывает все возможные символы URL или URL, которые ссылаются на ресурс послесуффикс домена (example.com/query?foo=bar
).