Как я могу обрабатывать русский текст в Perl? - PullRequest
1 голос
/ 28 апреля 2009

Я новичок в том, чтобы делать что-либо с любым языком, кроме английского. До сих пор единственное, что я когда-либо делал с программированием, - это ввод основных английских букв + цифр и вывод их. Теперь я должен манипулировать некоторым текстом на русском языке (особенно со страницы русской википедии), но я понятия не имею, с чего начать. Я гуглю и гуглю, но все, что я получаю, это результаты, которые говорят о юникоде, UTF-8 и других вещах, но они не имеют смысла для меня, потому что я не уверен, к чему они относятся. Сами записи в Википедии написаны для людей, которые уже знают это.

Может ли кто-нибудь указать мне хорошее начальное место?

1 Ответ

7 голосов
/ 28 апреля 2009

Похоже, вы должны сначала понять, что такое Юникод. Статья Джоэла Спольски Абсолютный минимум для каждого разработчика программного обеспечения Абсолютно, положительно необходимо знать о Unicode и наборах символов (никаких оправданий!) может быть хорошей отправной точкой (хотя для опытных людей это довольно неинформативно).

После этого вы должны посмотреть, как Perl обрабатывает Unicode, например, взглянуть на Perl Unicode Tutorial .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...