Используйте модуль URI. Это сделает вашу жизнь намного лучше, и она должна быть включена в Perl по умолчанию.
http://metacpan.org/pod/URI
use URI;
my $line;
open(FH, "test.txt");
until(($line = <FH>) =~ /9/) {
chomp($line); # gets rid of the newline character
my $url = new URI($line);
print $url->scheme,'://',$url->host,'/',$url->path;
}
Это должно очистить части URL для вас.
Также вам действительно не нужно sub main
. В perl это неявно.
Редактировать Как отметил @spyroboy, это не нормализует URL для вас. Вам все еще нужно будет нормализовать детали с помощью некоторых средств, но то, что вы хотите сделать с нормализацией, не совсем ясно.