Хорошо, тогда попробуйте это:
#!/usr/bin/perl
use strict;
use warnings;
use LWP::UserAgent;
my $ua = LWP::UserAgent->new;
my $response = $ua->get("http://ru.wikipedia.org/wiki/Perl");
die $response->status_line unless $response->is_success;
my $content = $response->decoded_content;
my @russian = $content =~ /\s([\x{0400}-\x{052F}]+)\s/g;
print map { "$_\n" } @russian;
Я полагаю, что набор символов кириллицы начинается с 0x0400
, а набор символов кириллицы заканчивается на 0x052F
, поэтому многие слова должны быть получены.