Удалить ссылки из текста - PullRequest
0 голосов
/ 24 ноября 2010

Как я могу удалить ссылки из текста?Я думаю, что мне следует использовать команду sed, но я не знаю точной синтаксики.

1 Ответ

0 голосов
/ 27 ноября 2010

Это удалит все, оканчивающееся на .com или .org:

sed 's/\s\?\w\+\.\(com\|org\)//g' foo.txt

.здесь это в стандарте POSIX.Я также добавил еще несколько символов, чтобы соответствовать случаям, когда могут быть субдомены или протоколы (http://)

sed 's/[[:space:]]\?[A-Za-z0-9_\/\:\.-]\+\.\(com\|org\)//g' foo.txt 

Также обратите внимание, что это не охватывает все возможные символы URL или URL, которые ссылаются на ресурс послесуффикс домена (example.com/query?foo=bar).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...